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作为 普通 高 等 教育 "十 一 五 ?国家 级 规划 教材 《算法 设计 与 分 析 兴 第 1 版 ) 出 版 已 经 近 
5 年 了 . 在 这 5 年 的 时 间 里 ,大 数据 ` 云 计算 “互联 网 + 等 新 领域 .新 问题 .新 的 应 用 层 出 不 
穷 ,许多 问题 求解 都 离 不 开 问题 的 建 模 和 算法 的 设计 与 分 析 . 

这 次 修订 保持 了 第 1 版 原 书 的 基本 结构 .主要 内 容 与 写作 特色 ,仍旧 以 算法 设计 技术 为 
主线 来 组 织 素 材 ， 考虑 到 线性 规划 与 网 络 流 问 题 在 实践 中 的 广泛 应 用 ,本 书 增加 了 这 两 章 
(第 6.7 章 ) 内 容 , 并 在 第 9 章 中 增添 了 整数 线性 规划 的 NP 完全 性 证 明 . 此 外 ,补充 了 部 分 
习题 ,并 对 原 书 的 某 些 朴 漏 之 处 进行 了 更 新 . 

与 本 书 同步 更 新 的 还 有 教学 辅导 用 书 ( 算 法 设计 与 分 析 习 题解 答 与 学 习 指 导 》( 第 2 
版 ) .PPT 电子 课件 ,本 书 MOOC 视频 教学 资源 也 将 于 近期 完成 . 

本 书 第 1 一 4 章 由 届 婉 玲 完成 ,第 5、8 章 由 王 捍 贫 完成 ,第 6.7、9、10 章 由 张 立 昂 完 成 ， 
第 11、12 章 由 刘 田 完成 . 对 广大 读者 所 提出 的 建议 和 意见 ,我们 表示 衷心 的 感谢 ! 


作 者 
2015 年 11 月 于 北京 大 学 


作为 问题 求解 和 程序 设计 的 重要 基础 “算法 设计 与 分 析 ” 在 计算 机 科学 与 技术 专业 的 
课程 体系 中 是 一 门 重要 的 必修 课 。 通 过 该 课程 的 学 习 , 不 但 为 学 习 其 他 专业 课程 葛 定 了 扎 
实 的 基础 ,也 对 培养 学 生 的 逻辑 思维 和 创造 性 有 着 不 可 替代 的 作用 . ACM IEEE Computing 
Curricula 2004 与 我 国教 育 部 高 等 学 校 计算 机 科学 与 技术 专业 教学 指导 委员 会 提出 的 (计算 
机 科学 与 技术 专业 规范 ?都 把 该 课程 列 人 本 专业 的 核心 课程 之 一 . 纵 观 计算 机 学 科 数 十 年 发 
展 的 历史 ,算法 与 计算 复杂 性 理论 一 直 是 计算 机 科学 研究 的 热点 和 活跃 领域 ,也 是 获得 图 灵 
奖 最 多 的 研究 领域 之 一 . 面 对 计 算 机 应 用 领域 的 大 量 问 题 ,最 重要 的 是 根据 问题 的 性 质 选 择 
正确 的 求解 思路 , 即 找到 一 个 好 的 算法 . 特别 在 复杂 的 ,海量 信息 的 处 理 中 ,一 个 好 的 算法 往 
往 起 着 决定 性 的 作用 . 

目前 已 经 出 版 了 许多 算法 教材 ,各 有 特色 . 作为 国家 高 等 教育 “十 一 五 ”规划 教材 ,我 们 
在 多 年 从 事 算法 设计 分 析 及 计算 复杂 性 理论 的 教学 和 研究 的 基础 上 .精心 选材 ,完成 了 本 书 
的 写作 . 本 书 的 主要 特点 是 : 

(1) 以 算法 设计 技术 为 主线 来 组 织 素材 ,深入 分 析 各 种 设计 技术 的 适用 范围 .设计 步 
又 、 算 法 的 正确 性 证 明 与 复杂 度 的 分 析 方法 改进 算法 的 途径 .局限 性 等 . 与 通常 的 算法 与 数 
据 结构 教材 有 所 不 同 , 本 书 不 过 多 地 关注 实现 细节 ,算法 描述 采用 伪 码 ,力求 突出 对 问题 本 
身 的 分 析 和 求解 方法 的 阐述 ,从 问题 建 模 、 算 法 设计 与 分 析 改进 措施 等 方面 给 出 适当 的 建 
议 ,为 从 事实 际 问题 的 算法 设计 与 分 析 工作 在 理论 上 提供 清晰 的 ,整体 的 思路 和 方法 ， 

(2) 从 对 具体 算法 的 设计 技术 与 分 析 方 法 ,自然 过 渡 到 对 问题 难度 的 分 析 和 界定 . 这 里 
处 理 的 不 是 一 个 具体 的 算法 ,而 是 对 求解 该 问题 的 一 大 类 算法 的 评价 和 分 析 , 是 对 问题 本 身 
计算 复杂 度 的 估计 . 基于 这 种 分 析 , 就 能 回答 “求解 该 问题 的 最 好 算法 是 什么 ”“ 它 能 好 到 什 
么 程度 "等 问题 ,从 而 为 选择 最 好 的 算法 给 出 依据 .一般 的 算法 教材 涉及 这 方面 的 知识 比较 
少 , 本 书 比较 系统 地 介绍 了 一 些 关 于 问题 复杂 度 的 分 析 方 法 . 

(3) NP 完全 理论 是 计算 复杂 性 理论 的 核心 内 容 , 其 中 “*P 取 NP” 的 问题 是 21 世纪 最 重 
要 的 数学 难题 之 一 . 计算 复杂 性 理论 关注 的 不 仅仅 是 某 个 具体 问题 ,而 是 希望 了 解 每 一 个 
问题 在 计算 难度 的 层次 结构 中 到 底 处 于 什么 位 置 ,不同 问 题 的 难度 之 间 有 什么 关系 . 本 书 力 
求 用 清晰 易 懂 的 语言 ,对 计算 复杂 性 理论 的 核心 内 容 和 针对 难 解 问题 的 处 理 策 略 加 以 简单 
的 介绍 ,希望 为 那些 从 事 复杂 问题 求解 的 读者 提供 一 点 帮助 . 

(4) 本 书 的 素材 来 自 多 年 的 教学 积淀 ,选材 适当 ,组 织 合理 , 先 引 入 基本 概念 和 数学 基 
础 知识 ,然后 进入 算法 设计 与 分 析 的 核心 内 容 . 在 叙述 中 不 但 注意 理论 的 严谨 ,也 精 选 了 大 
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量 生动 有 趣 的 例子 . 每 章 都 配 有 难度 适当 的 练习 ,适合 教学 使 用 . 

全 书 共 10 章 , 第 1 章 是 基础 知识 ,介绍 和 算法 设计 与 分 析 有 关 的 基本 概念 、 符 号 和 数学 
知识 ;第 2 一 5 章 分 别 阐述 分 治 策略 ,动态 规划 、 贪 心 法 、 回 溯 与 分 支 限 界 等 算法 设计 技术 ;第 
6 章 介 绍 算法 分 析 与 问题 的 计算 复杂 度 ; 第 7 章 是 NP 完全 性 理论 ;第 8 章 是 近似 算法 ;第 
9 章 是 随机 算法 ;第 10 章 介绍 处 理 难 解 问题 的 策略 . 

本 书 既 可 以 作为 本 科 生 教材 ,也 可 以 作为 研究 生 教材 . 对 于 本 科 生 教学 ,建议 讲授 第 
1 一 6 章 的 全 部 内 容 , 第 7 一 10 章 可 根据 情况 选择 部 分 内 容 做 一 些 概括 性 的 介绍 . 研究 生 教 
学 可 以 选择 第 1 一 9 章 的 全 部 内 容 , 第 10 章 可 根据 情况 选 讲 . 此 外 ,对 于 从 事实 际 问题 求解 
的 研究 工作 者 ,本 书 也 可 以 作为 一 本 算法 设计 与 分 析 的 人 门 参 考 书 . 

为 了 更 好 地 为 使 用 本 教材 的 读者 服务 ,作者 正在 撰写 和 开发 与 本 教材 配套 的 教学 辅导 
书 和 PPT 电子 教案 . 

本 书 的 第 1 一 4 章 由 届 婉 玲 完成 ,第 5 一 6 章 由 王 捍 贫 完 成 ,第 7 一 8 章 由 张 立 昂 完成 ,第 
9 一 10 章 由 刘 田 完成 . 

在 编写 过 程 中 ,作者 参考 了 国内 外 多 种 版 本 的 算法 设计 与 分 析 以 及 计算 复杂 性 方面 的 
教材 .论文 和 专著 ,从 中 吸取 了 一 些 好 的 思路 和 素材 ,在 此 一 并 向 有 关 作 者 致谢 . 特别 感谢 李 
晓 明教 授 审 阅 了 初稿 并 提出 了 宝贵 意见 ,感谢 清华 大 学 出 版 社 对 本 书 出 版 的 大 力 支 持 .我 们 
期 待 着 广大 读者 ,特别 是 使 用 本 书 的 教师 和 学 生 对 本 书 的 批评 .指正 和 建议 


作 者 
2010 年 11 月 写 于 北京 大 学 
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| 基础 知识 


1.1 有 关 算 法 的 基本 概念 


对 于 给 定 的 问题 ,一 个 计算 机 算法 就 是 用 计算 机 求解 这 个 问题 的 方法 . 一 般 来 说 ,算法 
由 有 限 条 指令 构成 ,每 条 指令 规定 了 计算 机 所 要 执行 的 有 限 次 运算 或 者 操作 . 下 面 先 看 几 
个 具体 例子 . 

例 1.1 有 nn 个 客户 带 来 n 项 任务 等 待 在 一 个 机 器 上 加 工 , 这 些 任务 记 为 1,2,…,n. 设 
第 j 项 任务 的 加 工时 间 是 4. j 二 1.2,…,n. 一 个 可 行 的 调度 方案 是 1,2,…,n 的 一 个 排列 
设 ，iz，"** ois, 对 于 排 在 第 j 个 位 置 的 任务 i; ,这 个 客户 所 需要 等 待 的 时 间 是 任务 i; 本 身 的 加 
工时 间 与 排 在 它 前 面 的 所 有 任务 加 工时 间 之 和 , 即 Gi) 二 4 十 十 … 十 ,十 刀 . 而 所 有 
客户 的 总 等 待 时 间 就 是 每 项 任务 的 等 待 时 间 之 和 . 为 了 使 得 尽 可 能 多 的 客户 满意 ,我 们 希望 
找到 使 得 总 等 待 时 间 最 少 的 调度 方案 . 

为 了 完成 算法 的 设计 与 分 析 ,需要 用 数学 语言 将 这 个 问题 加 以 形式 化 描述 . 先 分 析 一 下 
总 等 待 时 间 的 构成 : 第 1 项 任务 只 需要 等 待 自己 的 加 工时 间 , 第 2 项 任务 需要 等 待 前 两 项 
任务 的 加 工时 间 ，……… :第 项 任务 需要 等 待 所 及 项 任务 的 加 工时 间 . 因此 ,在 总 等 待 时 间 
的 计算 公式 中 ,第 1 项 任务 的 加 工时 间 出 现 n 次 ,第 2 项 任务 的 加 工时 间 出 现 n 一 1 次 ,……， 
第 上 项 任务 的 加 工时 间 出 现 n 一 k 十 1 次 .因此 这 个 调度 问题 可 以 描述 如 下 : 

问题 : 给 定 任务 集合 =={1,2,…,n), Yj€E SS, 加工 时间 志 E21+ ,Z+ 为 正 整 数 集合 , 求 


S 的 排列 记 ，is。，… ,i 使 得 So Dz 最 小 . 


k=1 

一 种 可 能 的 想法 就 是 “加 工时 间 短 的 任务 先 做 ”. 把 任务 按照 加 工时 间 的 递增 顺序 排序 ， 
即 如 果 ;< 六 那么 ;二 .然后 按照 标号 从 小 到 大 的 顺序 进行 加 工 . 例如 ,给 定 S={1,2,3， 
4} ,二 5,ts 二 20,t3 二 3,44 二 15. 那么 这 种 加 工 顺序 就 是 3,1,4,2. 按照 这 种 顺序 的 总 等 待 时 
间 是 T=3X4 十 5X3 十 15X2 十 20=77. 

以 上 设计 的 算法 是 一 种 贪心 算法 . 我 们 需要 考虑 的 问题 是 : 

(1) 如 何 一 步 一 步 地 给 出 这 个 算法 的 清晰 描述 ? 

(2) 这 个 算法 是 否 对 所 有 有 效 的 输入 都 能 得 到 正确 的 解 ? 如 果 能 ,怎样 证 明 ? 如 果 不 
能 ,能 否 举 出 反例 ? 


代 法 谈 计 与 分 帮 ( 血 2 版 ) 


我 们 还 可 以 进一步 考虑 ,什么 类 型 的 问题 可 以 使 用 贪心 算法 的 设计 技术 ? 如 果 对 某 些 
问题 ,贪心 算法 不 能 得 到 正确 的 解 , 还 有 没有 其 他 设计 技术 ? 回答 这 些 问题 涉及 算法 的 描 
述 、 算 法 的 设计 技术 ,算法 的 正确 性 证 明 等 ,这 些 都 与 算法 设计 与 分 析 领 域 的 基本 理论 及 方 
法 相关 . 它们 构成 了 这 本 书 的 主要 内 容 . 

例 1.2 排序 问题 是 大 家 所 熟悉 的 问题 ,已 经 存在 的 有 搬入 排序 . 冒 泡 排序 .选择 排序 、 
快速 排序 \ 堆 排序 等 多 种 算法 . 其 中 哪些 算法 运行 效率 更 高 ? 是 否 存在 更 好 的 算法 ? 为 解决 
这 些 问题 ,需要 对 算法 的 运行 效率 给 出 科学 的 量化 定义 一 一 算法 在 最 坏 情况 和 平均 情况 下 
的 时 间 复 杂 度 ,并 给 出 计算 这 两 种 时 间 复 杂 度 的 方法 . 例如 上 述 排 序 算 法 中 插入 排序 与 冒 泡 
排序 都 是 O(n? )? 时 间 的 算法 ,而 快速 排序 在 最 坏 情况 下 是 O(n?) 时 间 的 算法 ,平均 情况 下 
是 O(nlogn) 时 间 的 算法 . 堆 排序 在 两 种 情况 下 都 是 O(nlogn) 时 间 的 算法 .这些 都 是 针对 一 
个 给 定 算法 的 分 析 工 作 . 是 否 存在 更 有 效 的 算法 则 涉及 对 问题 难度 的 界定 ,与 一 个 具体 算法 
的 分 析 相 比 ,这 是 不 同 层次 的 问题 . 问题 难度 是 由 问题 本 身 的 内 在 性 质 决定 的 ,与 求解 它 
的 具体 算法 无 关 . 希望 能 对 问题 难度 给 出 界定 ,从 而 为 设计 与 评价 相关 的 算法 提供 可 靠 
依据 ， 

遗憾 的 是 ,目前 只 有 少量 问题 得 到 了 有 关 难 度 下 界 的 分 析 结 果 . 比如 排序 问题 ,已 经 证 
明了 对 于 个 元 素 进行 排序 ,任何 基于 元 素 比 较 运算 的 算法 在 最 坏 及 平均 情况 下 一 定 对 某 
个 输入 至 少 要 做 (zlogz)@ 次 比较 . 这 说 明 在 这 个 算法 类 中 不 可 能 找到 时 间 复 杂 度 比 
O(nlogn) 更 好 的 排序 算法 (对 某 些 特定 数组 的 排序 ,如 果 算 法 的 运算 不 限于 元 素 之 间 的 比 
较 , 则 存在 更 好 的 算法 ) ,这 也 意味 着 现 有 的 某 些 算法 已 经 是 求解 排序 问题 的 最 有 效 的 算法 . 

有 关 算 法 以 及 问题 复杂 度 的 分 析 也 是 本 书 的 主要 内 容 . 

例 1.3 货 郎 问题 设 有 个 城市 .已 知 其 中 任何 两 个 城市 之 间 ( 不 经 过 第 三 个 城市 ) 
道路 的 距离 .一 个 货 郎 需要 到 每 个 城市 巡回 卖 货 ,他 从 某 个 城市 出 发 ,每 个 城市 恰好 经 过 一 
次 ,最 后 回 到 出 发 的 城市 . 问 怎样 走 使 得 总 的 路 程 最 短 ? 

先 建立 问题 的 数学 模型 . 即 

问题 : 有 穷 个 城市 的 集合 C= {eycz,…'cn)} ,距离 dcc) 一 doc)E2Z+ 1 委 i<< 
jm. 

求 1,2,…,m 的 排列 Al ,As ,…,Aw 以 求 得 最 小 值 


min{ Dac, sh | +d(le, ‘Ch )} 
下 面 给 出 问题 的 一 个 实例 , 即 
C= {clyczycayct}， d(ciycz) 一 10， 
aciycs) 一 5，d(cvcs) 一 9， 
d(cssc3) =6, dl(cssc) =9, dl(cssc)=3 图 1.1 货 郎 问题 的 实例 
这 个 实例 也 可 以 用 图 来 表示 , 见 图 1. 1. 上 述 问 题 就 是 著名 的 
货 郎 问题 . 使 用 图 论 的 术语 .这 个 问题 可 以 表述 为 : 如 何在 带 权 完 全 图 G 中 找 一 条 最 短 哈密 
顿 (Hamilton) 回 路 . 
假定 从 ci 出 发 ,一 种 可 行 的 算法 就 是 穷 举 所 有 可 能 的 排列 韦 二 1.i。,… ,i。( 代 表 旅 行路 


O@ 关于 O( ) 和 Q( ) 记 号 ,后 面 将 给 出 定义 . 
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线 ,ci ，… ,ci :01) ,然后 针对 每 个 排列 计算 路 径 长 度 之 和 ,从 而 确定 最 短路 径 . 一般 把 这 种 
算法 称 为 蛮 力 算法 ”. 对 于 任何 组 合 问题 都 有 一 个 搜索 空间 ,搜索 空间 的 某 些 结 点 对 应 了 问 
题 的 可 行 解 , 而 其 中 有 的 结 点 对 应 了 最 优 解 . 蛮 力 算法 不 需要 分 析 解 之 间 的 关系 以 利用 其 相 
关 的 信息 ,也 不 需要 考虑 其 他 加 快 搜索 的 技术 ,因此 是 一 种 很 笨 的 算法 ,效率 不 高 . 我 们 所 考 
虑 的 算法 设计 技术 ,是 通过 分 析 问 题 的 结构 找到 最 好 的 搜索 策略 ,以 得 到 比 蛮 力 算 法 更 高 的 
效率 . 

和 例 1. 1 不同 ,对 于 货 郎 问题 ,到 目前 为 止 还 没有 找到 比 蛮 力 算法 有 着 本 质 改 进 的 高 效 
算法 ( 指 算法 的 时 间 复 杂 度 由 指数 函数 降 为 多 项 式 函 数 ). 这 就 促使 我 们 考虑 更 多 的 问题 ， 
如 果 对 一 个 问题 经 过 多 年 的 努力 还 没有 找到 有 效 的 算法 ,这 是 否 揭示 了 这 个 问题 本 质 上 的 
“ 难 解 性 ”? 这 类 问题 大 量 存在 于 各 个 不 同 的 研究 和 应 用 领域 . 自从 20 世纪 70 年 代 建立 了 
计算 复杂 性 的 核心 理论 一 一 NP 完全 性 理论 一 一 以 来 ,已 经 发 现 了 数 千 个 判定 问题 (问题 的 
解 是 Yes 或 者 No. 货 郎 的 判定 问题 是 其 中 之 一 . 考虑 图 1. 1 的 例子 ,如 果 问 : 是 否 存 在 一 条 
不 超过 20 的 旅行 路 线 ? 这 就 变 成 了 货 郎 判定 问题 的 一 个 实例 ). 可 以 证 明 这 些 判定 问题 的 
难度 在 是 否 可 有 效 计算 的 意义 上 彼此 等 价 . 换 句 话说 ,如 果 其 中 一 个 问题 能 够 有 效 求解 , 那 
么 所 有 这 些 问题 都 能 有 效 求解 ;如 果 证 明了 其 中 一 个 问题 没有 有 效 的 算法 ,那么 所 有 这 些 问 
题 都 是 难 解 的 . 在 计算 复杂 性 理论 中 把 这 类 判定 问题 称 为 NP 完全 问题 0. 我 们 关心 的 是 ，: 
NP 完全 问题 到 底 是 不 是 难 解 的 ? 经 过 数 十 年 的 研究 已 经 得 到 一 些 结果 ,但 是 到 目前 为 目 
还 没有 本 质 上 的 突破 . 这 个 问题 就 是 著名 的 “P= 二 NP?” 的 问题 ,已 列 和 人 21 世纪 数学 界 最 重要 
的 问题 之 一 .与 此 相关 的 是 在 各 个 应 用 领域 有 大 量 的 实际 问题 ,已 经 证 明 其 难度 至 少 和 NP 
完全 问题 一 样 ,人 们 不 得 不 为 处 理 这 类 问题 寻找 各 种 应 对 的 策略 ， 

上 面 三 个 例子 分 别 显 示 了 从 某 个 具体 算法 的 设计 与 分 析 技 术 , 到 针对 某 个 问题 的 算法 
类 的 分 析 技术 一 一 问题 难度 的 确认 ,最 后 到 不 同 问题 之 间 的 难度 分 析 一 一 计算 复杂 性 理论 
这 样 三 种 不 同 的 研究 层次 .我 们 将 按照 这 样 一 种 由 低 到 高 .由 具体 到 抽象 的 思路 来 安排 各 章 
的 内 容 . 在 介绍 了 NP 完全 理论 之 后 ,将 对 近似 算法 、 概 率 算法 等 比较 活跃 的 研究 方向 ,以 及 
面 对 NP 难 问 题 的 应 对 策略 加 以 介绍 . 

先 说 明 一 些 有 关 算法 的 基本 概念 . 

问题 是 需要 回答 的 一 般 性 提问 ,通常 含有 若干 参数 . 为 了 清晰 地 描述 一 个 问题 ,需要 说 
明 参 数 的 含义 和 解 所 满足 的 条 件 . 如 果 对 问题 参数 给 出 一 组 赋值 ,就 得 到 了 问题 的 一 个 实 
例 . 例 1.3 的 货 郎 问题 就 是 这 样 描述 的 ,今后 所 提 到 的 问题 都 是 指 它 的 所 有 实例 构成 的 抽象 
描述 ,不 是 特 指 一 个 具体 的 实例 

算法 是 有 限 条 指令 的 序列 ,这 个 指令 序列 确定 了 解决 某 个 问题 的 运算 或 操作 的 步骤 . 算 
法 A 解 问题 P 是 指 : 把 问题 P 的 任何 实例 作为 算法 A 的 输入 ,A 能 够 在 有 限 步 停机 ,并 输 
出 该 实例 的 正确 解 . 

算法 的 时 间 复 杂 度 是 对 算法 效率 的 度量 . 如 何 度量 一 个 算法 的 效率 ? 理论 上 不 能 用 算 
法 在 机 器 上 真正 的 运行 时 间作 为 度量 标准 . 因为 运行 时 间 依 赖 于 机 器 的 硬件 性 能 ,如 CPU 
速度 等 ,也 依赖 于 程序 的 代码 质量 . 我 们 希望 这 个 度量 能 够 反映 算法 本 身 的 性 能 . 因此 ,一 般 
的 做 法 是 针对 问题 选择 基本 运算 .用 基本 运算 次 数 来 表示 算法 的 效率 , 运算 次 数 越 多 ,效率 


中 关于 NP 完全 问题 将 在 第 9 章 给 出 定义 . 
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就 越 低 . 为 了 给 出 时 间 复 杂 度 的 清晰 定义 ,有 两 个 问题 需要 解决 . 第 一 个 问题 是 算法 运算 次 
数 与 问题 的 实例 规模 有 关 ( 关 于 实例 规模 的 精确 定义 见 第 9 章 ) ,如何 表示 这 种 依赖 关系 . 
比如 对 整数 数组 排序 ,其 基本 运算 是 数 之 间 的 比较 . 显然 100 000 个 数 的 数组 比 10 个 数 的 
数组 所 需要 的 比较 次 数 要 多 得 多 ,在 这 里 数组 的 大 小 * 一 100 000 或 10 代表 了 不 同 的 实例 
规模 . 可 以 用 函数 来 解决 这 个 问题 , 即 把 排序 算法 对 规模 为 的 输入 实例 所 做 的 比较 次 数 看 
作 n 的 函数 TT(n) , 即 算法 的 时 间 复 杂 度 函数 .第 二 个 问题 是 对 规模 为 n 的 两 个 不 同 的 输入 
实例 ,算法 的 运算 次 数 也 可 能 不 一 样 ,选择 哪 一 个 作为 它 的 时 间 复 杂 度 函数 .比如 插入 排 
序 . 假如 算法 的 输入 是 3,2,5,4,1. 初始 输出 数组 只 保留 第 一 个 数 3, 然 后 算法 依次 在 这 个 数 
组 中 插入 2,5,4,1. 插 入 时 ,把 要 插入 的 元 素 从 后 向 前 与 数组 中 的 数 比 较 , 找 到 应 该 插入 的 
正确 位 置 . 比如 ,首先 把 2 与 3 比较 ;因为 2 比 3 小 ,把 2 插 到 3 的 前 面 ,数组 变 成 2, 3. 接着 
把 5 与 3 比较 ,5 比 3 大 ,因此 5 插 到 3 的 后 面 ,数组 变 成 2, 3, 5. 类 似 地 ,在 3 和 5 之 间 插 入 
4; 最 后 在 2 前 面 插入 1, 从 而 得 到 输出 1,2,3,4,5. 如 果 输 入 数组 是 1,2,…,n, 那 么 插入 2 需 
要 1 次 比较 ,插入 3 需要 1 次 比较 ,…… ,插入 也 仅 需 要 1 次 比较 ,总 计 一 1 次 就 够 了 .但 
是 ,对 于 以 相反 次 序 排列 的 输入 数组 4,n 一 1,… ,2,1, 同 样 的 插入 排序 算法 所 需要 的 比较 次 
数 则 是 1 十 2 十 … 十 n 一 1 二 n(n 一 1)/2 次 比较 .上述 两 个 实例 的 规模 都 等 于 ,但 插入 算法 所 
做 的 比较 次 数 不 一 样 . 为 了 解决 这 个 问题 ,通常 将 算法 的 时 间 复 杂 度 分 为 最 坏 情 况 下 的 时 间 
复杂 度 与 平均 情况 下 的 时 间 复 杂 度 . 所 谓 最 坏 情 况 下 的 时 间 复 杂 度 代表 了 该 算法 求解 输入 
规模 为 的 实例 所 需要 的 最 长 时 间 W(n) ;而 平均 情况 下 的 时 间 复 杂 度 代表 了 该 算法 求解 
输入 规模 为 的 实例 所 需要 的 平均 时 间 A (n). 

以 检索 问题 为 例 , 给 定 按照 递增 顺序 排列 的 数组 工 , 其 中 含有 个 不 同 的 元 素 . 现在 需 
要 在 工 中 检索 zx. 如 果 工 在 工 中 出 现 ,那么 输出 xz 所 在 的 位 置 ,否则 输出 0. 如 下 设计 顺序 检 
索 算 法 : 从 工 的 第 一 个 元 素 开 始 采 用 顺序 与 x 比较 的 方法 ,如 果 第 j 个 元 素 等 于 z ,那么 输 
出 j, 算 法 结束 . 如 果 直 到 最 后 一 个 元 素 为 止 ,没有 元 素 等 于 xz, 那么 输出 0, 算 法 结束 . 对 于 
nn 个 元 素 的 数组 L ,xz 可 能 是 第 一 个 元 素 , 算法 只 要 比较 1 次 就 结束 了 ;zx 也 可 能 是 最 

一 个 元 素 或 者 x 根本 不 在 数组 中 出 现 ,那么 算法 就 需要 比较 n 次 才能 结束 . 对 于 规模 为 
ee 算法 的 比较 次 数 是 不 一 样 的 ,最 坏 的 情况 是 指 对 于 某 个 输入 运算 次 数 达 
到 最 多 的 那 种 情况 . 显然 对 于 顺序 检索 最 坏 情 况 下 的 时 间 复 杂 度 函数 W(n) 王 n. 为 了 计算 
平均 情况 的 时 间 复 杂 度 函数 ,需要 给 出 规模 为 的 所 有 输入 实例 的 概率 分 布 . 假定 实例 集合 
为 S, 实 例 IES 出 现 的 概率 是 p;, 算法 对 于 了 所 做 的 基本 运算 次 数 为 ti ,那么 平均 情况 下 


的 时 间 复 杂 度 为 pr 以 顺序 检索 算法 为 例 , 假 定 z 在 L 中 的 概率 是 p ,并且 处 在 L 每 

个 位 置 4 概率 相等 ， .那么 平均 情 青 况 下 的 时 间 复 杂 度 函数 是 ， 

pnt 1) 
2 


ACD) Di2+a pn + (1— Pn 
i=1 


对 于 同样 的 问题 可 以 设计 不 同 的 算法 ,不 同 算法 的 时 间 复 杂 度 函数 可 能 是 不 一 样 的 . 什么 
算法 在 实践 中 是 可 以 接受 的 算法 ? 划 定 这 个 界限 对 处 理 实际 问题 有 着 重要 的 意义 . 这 个 界限 
就 是 考查 算法 是 不 是 多 项 式 时 间 的 . 以 最 坏 情 况 下 的 时 间 复 杂 度 函数 为 例 , 多 项 式 时 间 的 算法 
是 指 在 最 坏 情况 下 的 时 间 复 杂 度 函数 在 充分 大 时 以 P(n) 为 上 界 的 算法 ,其 中 ,P(X) 是 的 
多 项 式 . 而 对 于 许多 实际 的 算法 ,比如 Hanoi 塔 的 递归 算法 ( 见 例 1. 10), 根 本 不 存在 多 项 式 
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P(n) ,使 得 该 算法 最 坏 情况 下 的 时 间 复 杂 度 函数 在 n 充分 大 时 以 P(n) 为 上 界 , 这 些 算法 可 
能 是 指数 时 间 的 算法 或 者 时 间 复 杂 度 更 高 的 算法 . 如 果 使 用 指数 时 间 的 算法 ,对 于 比较 大 的 
n, 实践 中 是 根本 不 能 工作 的 . 根据 这 个 分 析 , 就 可 以 对 实际 上 可 求解 问题 的 范围 进行 更 清 
晰 的 划分 , 即 多 项 式 时 间 可 解 的 问题 与 难 解 的 问题 . 关于 这 个 问题 将 在 第 9 章 进行 详细 的 
讨论 . 
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1.2 算法 的 伪 码 描述 


我 们 将 使 用 伪 码 描述 算法 . 伪 码 由 带 标 号 的 指令 构成 ,但 是 它 不 是 CC++ 、Java 等 通常 
使 用 的 程序 设计 语言 ,而 是 算法 步骤 的 描述 . 它 包含 赋值 语句 ,并 具有 程序 的 主要 结构 ,如 顺 
序 、 分 支 (if then else) .循环 (while,for,repeat until) 等 。 为 了 叙述 的 方便 ,我 们 也 允许 使 用 
转向 语句 (goto). 有 时 也 可 以 在 某 些 语句 后 面 加 上 注释 . 输出 语句 由 关键 字 return 后 面 跟随 
着 输出 变量 或 函数 值 等 构成 . 当 在 循环 体内 遇 到 输出 语句 时 ,不 管 是 否 满足 循环 的 条 件 , 算 
法 将 停止 进一步 的 迭代 ,立刻 进行 输出 ,然后 算法 停止 运行 .下面 是 伪 码 的 具体 表示 : 

赋值 语句 : 一 

分 支 语句 : if…then…[else…] 

循环 语句 : while, for, repeat until 

转向 语句 : goto 

输出 语句 : return 

调用 

注释 : // 

伪 码 程序 中 常常 忽略 变量 或 函数 的 说 明 , 有 时 也 不 指明 算法 所 使 用 的 数据 结构 . 伪 码 程 
序 也 常常 忽略 程序 的 实现 细节 .忽略 这 些 , 是 为 了 更 加 专注 于 算法 的 设计 技术 与 分 析 方 法 ， 
即 求解 问题 的 思路 与 方法 . 

伪 码 程序 中 的 语句 通常 带 有 标号 , 这 是 为 了 在 分 析 算法 的 工作 量 时 更 为 方便 ， 

算法 调用 子 过 程 时 ,只 需要 在 相应 的 语句 中 写 明 该 子 过 程 的 名 字 . 有 时 甚至 可 以 直接 使 
用 自然 语言 来 指出 使 用 的 函数 或 者 过 程 . 例如 “将 数组 A[1..nj 复 制 到 数组 B”,“ 将 数组 A 
的 元 素 按 照 递 增 的 顺序 排序 ”都 是 合法 的 语句 . 一 般 来 说 ,所 调用 的 子 过 程 应 该 是 前 面 已 经 
说 明 的 过 程 . 

下 面 是 一 些 伪 码 的 例子 . 其 中 ,Euclid 算法 计算 m 和 的 最 大 公约 数 , 顺 序 检索 算法 
Search 检查 z 是 否 在 数组 L 中 出 现 . 如 果 出 现 , 则 输出 zx 第 一 次 出 现 的 位 置 ; 否 则 输出 0. 

算法 1.1 Euclid(m,n) 

输入 : 非 负 整数 m,n, 其 中 mm 与 不 全 为 0 

输出 : m 与 n 的 最 大 公约 数 

1. while m>0 do 


2. rn modm 
3. 72< 7 
4. mr 


5. returnn 


站 法 恰 计 与 分 新 ( 黎 2 版 ) 


Euclid 算法 中 第 2 行 的 mod 是 取 模 运算 ,n mod m 表示 nn 除 以 mx 所 得 的 余数 , 一 般 余 
数 的 值 应 该 在 0 到 mm 一 1 之 间 . 

算法 1.2 ”Search(L,z) 

输入 : 数组 L[1..n], 其 元 素 按照 从 小 到 大 排列 , 数 zz 

输出 : 车 z 在 L 中 ,输出 zz 的 位 置 下 标 j; 否 则 输出 0 

1 7 

2. while j<n and zx>L[j] do j<) 十 1 

3. if x<L[j] or j>n then j<0 

4. returnj 

不 难看 出 算法 Search 在 行 2 把 zx 与 L 中 的 元 素 依次 进行 比较 . while 循环 的 结束 条 件 
是 zx<L[j] 或 者 jn. 当 xz=L[Ljj 时 ,这 个 j 就 是 zx 在 数组 中 第 一 次 出 现 的 下 标 ; 当 x 一 
L[j 站 时 或 者 j 一 n 时 ,zx 不 在 数组 L 中 . 因此 算法 在 最 坏 的 情况 下 所 执行 的 比较 次 数 是 n. 不 
难看 出 ,算法 Search 比 起 1. 1 节 提 到 的 顺序 检索 算法 已 经 有 了 改进 . 当 工 不 在 工 中 时 , 它 利用 
工 中 元 素 的 有 序 性 减少 了 比较 次 数 . 如 果 zx 在 表 的 n 个 位 置 和 十 1 个 空隙 (不 在 表 中 ) 的 
2n 十 1 种 输入 都 具有 相等 的 概率 ,请 读者 给 出 Search 算法 在 平均 情况 下 的 时 间 复 杂 度 函数 . 


1.3 算法 的 数学 基础 


在 讨论 算法 设计 与 分 析 技术 之 前 ,我 们 需要 介绍 一 些 相关 的 数学 知识 ,包括 函数 的 渐 近 
的 界 的 定义 与 性 质 、 算 法 分 析 中 常用 的 证 明 方法 、 序 列 求 和 的 技术 以 及 弟 推 方程 的 求解 . 


1.3.1 函数 的 渐 近 的 界 


在 算法 分 析 中 经 常用 到 定义 在 自然 数 集合 上 的 函数 /: N 习 N. 例如 二 分 检索 算法 最 坏 
情况 下 的 时 间 复 杂 度 为 O(logn) ,插入 排序 算法 最 坏 情况 下 的 时 间 复 杂 度 为 Ol? ) 等 . 这 里 
的 nn 表示 输入 规模 ,检索 问题 中 的 表示 被 检索 的 线性 表 中 的 元 素 个 数 , 排 序 问题 中 的 n 表 
示 被 排序 的 数组 中 的 元 素 个 数 . f(n) 二 O(logn) 表 示 函 数 f (nw) 在 nn 充分 大 时 以 clogn 为 上 
界 , 其 中 * 为 某 个 正 数 , 称 为 函数 jz) 的 渐 近 的 上 界 .类 似 地 ,也 可 以 定义 渐 近 的 下 界 . 如 果 
函数 jz) 的 渐 近 的 上 界 与 下 界 相等 ,都 是 g(n) ,这 时 也 称 g (x) 是 f(x) 的 渐 近 的 紧 的 界 , 或 
者 称 函 数 /(n) 的 阶 是 g(n). 考查 函数 渐 近 的 性 质 , 主 要 基于 以 下 的 考虑 : 首先 , 当 充分 大 
时 ,不 同 阶 的 函数 的 值 差别 非常 大 .例如 2" 与 n? 就 是 这 样 的 函数 . 因此 ,为 了 考查 算法 的 性 
能 ,我 们 更 应 该 关心 在 实例 规模 很 大 的 时 候 算法 所 表现 的 计算 效率 . 其 次 ,这 里 渐 近 的 界 的 
概念 ,也 抓 住 了 算法 分 析 中 影响 时 间 复 杂 度 函数 的 关键 因素 .使 得 分 析 过 程 更 为 简单 和 清 
晰 .很 可 能 算法 的 时 间 复 杂 度 函数 的 表达 式 T(n) 有 多 个 项 ,比如 T(n) 二 nn? 十 8n 一 5, 其 中 含 
有 三 项 : wr? ,8n, 一 5. 在 nn 充分 大 时 ,与 n* 比较 ,后 面 两 项 的 影响 可 以 忽略 不 计 . 而 T(n) 的 阶 
就 是 .这 种 阶 的 表示 恰好 反映 了 影响 算法 性 能 的 关键 因素 .下面 给 出 关于 隐 数 渐 近 的 界 
的 定义 . 由 于 讨论 与 算法 复杂 度 有 关 . 不 妨 假设 所 有 函数 f(n).g(n) 都 是 非 负 的 . 

定义 1.1 设 / 和 g 是 定义 域 为 自然 数 集 N 上 的 函数 . 

(1) 若 存 在 正 数 c 和 no 使 得 对 一 切 n 宇 n。 有 0 硅 f(n) 三 cg (0) 成 立 ， 则 称 f(n) 的 渐 近 
的 上 界 是 g(n), 记 作 f(n) 二 OC(g(n)). 


基础 知识 


(2) 若 存在 正 数 c 和 no ,使 得 对 一 切 n 宇 n。 有 0 三 cg(7) 达 fm) 成 立 , 则 称 f(n) 的 渐 近 
的 下 界 是 g(x) , 记 作 /0) 一 Q(g(n)). 

(3) 若 对 于 任意 正 数 c 都 存在 no .使 得 当 n 宇 no。 时 有 0 三 f(nw) 二 cg(n) 成 立 , 则 记 作 
f (1)=o(g(n)). 

(4) 车 对 于 任意 正 数 c 都 存在 no ,使 得 当 n 宇 no。 时 有 0 三 cg (mw) 三 f(n) 成 立 , 则 记 作 
f=w(g(n)). 

(5) 车 f(n)= 二 OCg(7)) 且 (2) 二 QCg(n)), 则 记 作 f(n)==8(g(n)). 

定义 1.1(1) 与 (2) 要 求 存 在 一 个 与 无 关 的 常数 c, 且 对 这 个 c 存在 no 使 得 n 宇 no 时 不 
而 (3) 中 的 c< 不 是 常数 , 它 可 以 任意 小 . 对 任意 的 c 都 存在 某 个 ,使 得 三 no 时 

等 式 成 立 . (1) 与 (3) 中 的 记号 分 别 叫 做 大 O 记号 ”与 “小 o 记号 ”, 它 们 的 区 别 在 于 : 当 
a Jo 的 阶 可 能 低 于 gx) 的 阶 ,也 可 能 等 于 gm) 的 阶 .而 /0 二 olg(m)) 时 ， 
Fo 的 阶 只 能 低 于 gx) 的 阶 . 因此 从 fm)= 二 oCg(m)) 可 以 推出 f(m)= 二 Ol(g(n)), 但 是 反 过 
来 不 成 立 . 例如 ,对 于 函数 Fnz) 王 姑 十 2 ,可 以 写 为 

fln) = On), fln) = O(m), fln) 一 oa) 

但 是 不 能 写 为 foo) 一 o(22). 类 似 地 ,对 于 大 2 与 小 w 记号 也 存在 相同 的 性 质 . (5) 中 的 9 记 
号 表示 /oa) 与 8g (nm) 的 阶 相等 ,这 时 /(m) 与 g(n) 的 增长 仅 差 一 个 常数 因子 ,也 称 作 g(n) 是 
了 (mn) 的 紧 的 界 . 正如 关于 @ 的 定义 所 显示 的 ,通过 缩小 在 上 界 和 下 界 之 间 的 差距 可 以 得 到 
这 个 紧 的 界 .注意 ,在 后 面 的 叙述 中 用 O(1) 来 表示 常数 函数 . 

有 时 也 可 以 直接 从 计算 交 趋 于 无 穷 时 的 极限 得 到 一 个 渐 近 的 紧 的 界 . 如 果 函 数 Foz) 和 
8(n) 之 比 当 n 趋 于 无 穷 时 趋向 一 个 正常 数 ,那么 /(n) 一 69(Cg(z)). 请 看 下 面 的 定理 

定理 1.1 设 / 和 g 是 定义 域 为 自然 数 集合 N 上 的 非 负 函数 


Ci 如 果 lim 人 存在 ， 并 且 等 于 某 个 常数 c>0, 那 么 /GD 一 BCgGoD))， 


人 
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Ca 如 果 limeeoy J 一 0， 那么 f(1m) 一 oCg(Cz) ). 


ee f0)=w(g(n)). 


证 假设 f(n) 与 g(n) 均 大 于 等 于 0. 


GD 由 于 lim 妈 史 一 <>>0, 根 据 极限 定义 ,对 给 定 的 正 数 s 一 c/2， 存 在 某 个 m, 只 要 
7 二 7o ,就 有 
fn) f00) 于 = A 3c 
g(n) Ey SA 2 | be 2 a 


于 是 ,对 所 有 的 n 三 no ,fl(n) 三 2cg(n). 从 而 推出 f(n) 二 Ol(g(n)); 并 且 对 所 有 的 n 三 no， 


ad ;从 而 推出 f (nm) 一 Q(g(n)). 


Ja 全 本 


(2) 任意 给 定 c 之 0. 由 于 Jim 


二 0, 根据 极 限定 义 , 对 于 se 一 c>0 存在 加 ,只 要 7 二 mo， 
就 有 |f(n)/g(n)|<=e， ed 于 是 f(n) 二 oC(g(n)). 


(3) 任意 给 定 <>0. 由 于 lim 人 (3 一 十 ~, 根据 极限 定义 ,对 于 M 一 c>0 存在 加 ,内 
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7 二 加 ,就 有 | Foz)/g(z)| 二 M=c, 即 Fo 二 Mg(CD) 一 cg(2) ,于 是 f(n) 二 w(g(n)). 

为 了 简单 起 见 , 在 下 面 的 讨论 中 有 时 候 也 将 /(n) 二 OC(g (nn)) 简 记 为 /二 O(g) ,类 似 地 
对 于 2 与 9 符号 也 有 相应 的 记 法 .下面 考 查 O,2 和 @ 的 性 质 . 

定理 1.2 设 /,g,h 是 定义 域 为 自然 数 集合 的 函数 ， 

(1) 如 果 f=O(g) 且 g= 二 O01) ,那么 f=O0h). 

(2) 如 果 f==Q(g) 且 g 二 QC(h) ,那么 f=Q(h). 

(3) 如 果 /==9(g) 和 g= 二 6(h) ,那么 f=B(h). 

证 (3) 是 (1) 和 (2) 的 直接 结果 ,而 (2) 的 证 明 与 (1) 类 似 ,因此 只 证 明 (1). 

根据 定义 ,存在 某 个 常数 c 和 wy， 对 所 有 的 nn 三 mi 有 (mw) 三 cg (mn). 类 似 地 ,存在 某 个 
常数 ce 和 n。， 对 所 有 的 三 ij 有 g(n) 三 czh(n). 于 是 , 邻 二 max{m,72), 当 n 宇 no 时 ,有 
fagn) ach(n) ,因此 f=0(). 

定理 1.3 假设 /和 g 是 定义 域 为 自然 数 集合 的 函数 ,车 对 某 个 其 他 的 函数 ,有 /一 
Oh) 和 gg 二 O00) ,那么 [十 g 二 Oh). 

这 个 证 明 与 定理 1. 2 类 似 , 留 做 练习 . 

使 用 数学 归纳 法 不 难 证 明 上 述 性 质 可 以 推广 到 个 函数 相 加 的 情况 . 即 令 k 是 固定 常 
数 , 且 有 1,f;，,…,f 和 hh 是 函数 , 且 对 所 有 的 i,fi 二 O00) ,i 二 1,2,… ,那么 用 十 fo 十 … 十 
fi=Oh). 

推论 ”假设 上 和 8& 是 定义 域 为 自然 数 集合 的 函数 , 且 满足 8g 二 OC 有 ), 那 么 /十 g 二 8( 由 . 

证 显然 /十 sg 二 Q(f1), 因 为 对 所 有 的 n 宇 0, 有 (nw) 十 g(n) 宇 f(m). 反 之 ,由 8g 二 
OC 有 ) 以 及 f==O(7) ,使 用 定理 1. 3 可 得 /十 g==0(). 


这 个 推论 也 可 推广 到 个 函数 的 和 . 
下 面 给 出 几 个 例子 . 
例 1.4 设 f(D) 一 去 民 一 3n, 证 明 f0) =O ). 
证 因为 
i 
1i fn) To 3 
i = lim 本 
1 十 co 72 十 co n 4 


根据 定理 1. 1 有 /Coz) 一 BCOz2 ). 

例 1.5 设 Fo) 王 62 ,证明 Fo 天 902 ). 

证 ”要 使 6m 三 cr 成 立 , 则 必 有 6n 三 c , 即 n 志 c/6, 而 nn 充分 大 ,这 与 c 是 常数 矛盾 ， 

下 面 给 出 一 些 算法 分 析 中 常用 的 复杂 度 函 数 的 渐 近 的 紧 的 界 . 

多 项 式 函 数 ff(n) 二 wi 十 qin 十 az 玉 十 … 十 agn 称 为 d 次 多 项 式 , 其 中 aj 关 0. 显然 有 
GOD 一 002 ) ,再 根据 定理 1.3 的 推广 结果 不 难 证 明 f(x) 二 O07), 因 此 得 到 f(n) 二 BG ). 

在 前 面 已 经 看 到 .一 个 多 项 式 时 间 的 算法 是 运行 时 间 T(n) 为 Ol) 的 算法 ,其 中 4 是 
某 个 常数 . 即使 一 个 算法 的 运行 时 间 没 有 写成 n 的 某 个 整数 备 , 它 也 可 能 是 多 项 式 时 间 的 . 
例如 在 第 2 章 我 们 将 看 到 一 个 运行 时 间 是 O(n*”) 的 整数 相 乘 的 算法 ,还 有 运行 时 间 是 
O(nlogn) 的 排序 算法 . 这 些 算法 也 是 多 项 式 时 间 的 . 

对 数 函 数 ”对 数 函 数 logsn 的 值 等 于 x 当 上 且 仅 当 好 一 2 对 数 运 算 满足 下 面 的 性 质 : 


Clogin 一 7zlogsa 
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只 要 对 上 述 等 式 两 边 取 以 2 为 底 的 对 数 .都 会 得 到 logsn logsa ,从 而 证 明了 上 述 等 式 成 立 . 
这 个 等 式 说 明 , 有 些 函 数 表面 上 看 .n 处 在 指数 位 置 . 但 是 它 不 一 定 是 指数 函数 ,有 可 能 仍旧 
是 多 项 式 函 数 . 

对 数 是 增长 得 非常 慢 的 函数 . 使 用 微 积 分 的 知识 很 容易 证 明 , 任 何 寡 函数 壮 (a 二 0) 都 
比 对 数 函 数 logsn 的 阶 高 ,这 里 的 a 可 以 是 非常 小 的 正 数 . 这 个 结果 具体 表述 如 下 : 

定理 1.4 对 每 个 6 二 1 和 每 个 w 盖 0, 有 logsn 二 oCn). 

对 数 函 数 的 另 一 条 性 质 是 : 对 于 不 同 的 底 a 与 5.logsn 一 B(logsn). 这 个 证 明 只 需要 使 
用 关于 对 数 的 基本 恒等式 


第 
| 
章 


logsn 
logsa 


就 可 以 得 到 ., 这 个 性 质 说 明 对 于 渐 近 的 界 来 说 ,对 数 的 底 并 不 重要 . 前 面 提 到 logn 通常 指 以 
2 为 底 的 对 数 , 它 与 其 他 数 为 底 的 对 数 之 间 只 相差 一 个 常数 因子 . 

最 后 需要 说 明 , 为 了 使 得 对 数 表达 式 更 简洁 ,将 把 (logn)* 记 为 log*n. 

指数 函数 ”这 里 出 现 的 指数 函数 是 形 如 /(n)= 二 "的 函数 ,其 中 为 某 个 大 于 1 的 常 
数 .与 对 数 函 数 相反 ,指数 函数 是 一 个 飞速 增长 的 函数 . 使 用 微 积 分 的 知识 不 难 证 明 指 数 函 
数 与 多 项 式 函 数 有 下 面 的 关系 . 

定理 1.5 对 每 个 >1 和 每 个 d>>0, 有 妈 dd 一 o( 普 ). 

这 个 结果 说 明 每 个 指数 函数 比 每 个 多 项 式 函 数 都 增长 得 快 .但 是 对 于 不 同 的 底 与， 
首 数 函数 与;" 的 阶 是 不 相同 的 . 底 越 大 .指数 函数 的 阶 就 越 高 . 

定理 1.4 和 定理 1.5 的 证 明 留 做 习题 . 

阶乘 函数 /2z) 一 24! 是 增长 很 快 的 函数 , 根据 斯 特 录 (Stirling) 公 式 , 阶 乘 函 数 

nl! Va (4) 6 | e(3)) 

关于 阶乘 函数 有 下 面 的 结果 : 


nl= oo), nl= w(2"), log(n!) = O(nlogn) 
前 两 个 等 式 直 观 上 很 容易 理解 . 考虑 最 后 一 个 等 式 , 因 为 


logen = 


. log(n!) . ln(n!)/ln2 .lual) 
lim lim im 
mm+e nlogn w+e nlnn/ln2 w+ Nlnn 
mn( Vaa(2) 所 十 (#))) 
lim - 二 (c 为 某 个 常数 ) 
Re nlnn 
ln V2z7 十 mln 卫 
lim 和 一 1 
et nlnn 


于 是 log(n!) 二 O(nlogn). 

例 1.6 下 面 给 定 一 些 函 数 ,请 把 它们 按照 渐 近 的 界 从 高 到 低 的 顺序 进行 排列 . 如 果 两 
个 函数 Fo) 与 g(n) 的 阶 相等 , 则 表示 为 1(m) 二 8@(g(n)). 
log:n; 1， nl, n2"*, now, (3/2)*, Vlogn,; (logn)™™,; 


22”， 7zioglom ， 


m, loglogz， nlogn, n, 2em ， logn. log(n!) 


解 指数 函数 的 阶 高 于 多 项 式 函 数 的 阶 ,而 多 项 式 函 数 的 阶 高 于 对 数 函 数 的 阶 . 因 
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此 有 
于 
n = O(2""), 


宙 2 久 


nl, 


在 


取 整 函数 具有 下 述 性 质 


(1) xz—1<lzx Ez<[z 


log27 
E 算 法 分 析 中 有 时 会 遇 到 取 整 函数 , 即 [x 汪 [x 1. 分 别称 作 底 函数 与 项 函数 .Lz 由 示 小 
F 等 于 xz 的 最 大 的 整数 ,而 [zx 人 陵 示 大 于 等 于 z 的 最 小 的 整数 . 例如 : 


8 


BC = Ws 


Vlogn, 


log(n!) = O(nlogn), 


logn. loglogn, n'*™ = O(1) 


B46 [2 


Kx 十 1 


(2) Lz 十 zx 六 LzjHm[z+2F[zHH 其中， 为 整数 


n 


n 


G3) | 
呆 


| 


上 


EE 


WD 2 
b =| 苇 


名 HH 名 其 中 为 整数 


n 


be nvawb 为 整数 


关于 这 些 性 质 的 证 明 留 做 练习 . 


1.3.2 求 和 的 方法 


在 算法 分 析 中 如 果 遇 到 循环 ,经 常 需要 对 循环 中 各 次 迭代 的 运算 次 数 求 和 ,从 而 得 到 


总 的 运算 次 数 , 这 就 用 到 了 序列 求 和 的 方法 . 
最 常见 的 序列 是 等 差 级 数 (ai) ,等 比 级 数 {ag*} 与 调和 级 数 {1/&}. 其 求 和 公式 分 别 为 
Da a n(ai 了 
一 Np 
2 下 一 地 2 1—z 
Si 二 = lnn + O01) 
k=1 


可 以 使 用 数学 归纳 法 证 明 等 差 与 等 比 级 数 的 求 和 公式 . 对 调和 级 数 求 和 得 到 的 不 是 精 


确 值 ,而 是 一 个 近似 值 . 对 了 
好 就 是 它 的 渐 近 的 界 . 下 面 
例 1.7 求 和 . 


el 


a 乞 RCkE+1) 
则 


nl 


之 


1 


给 出 一 些 求 和 的 例子 . 


1 


FF 算法 分 析 工 作 ,主要 关注 的 是 函数 的 渐 近 的 界 , 而 这 个 近似 值 正 


二 


k=1 


号 ( 


1 
和 
天 


需 丰 了 — 


1 


De De 


大 [3 
全 
t=1 t=1 


t=1 t=1 t=1 
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大 大 -1 
| 


De— > ie: SS\y k2:— (2 —1) = (k—1)2+1 

上 面 的 求 和 利用 了 基本 的 求 和 公式 . 例 1.7(2) 的 运算 式 将 在 二 分 检索 算法 平均 情况 下 
的 时 间 复 杂 度 分 析 公 式 中 用 到 . 

对 于 有 些 求 和 公式 , 求 不 出 精确 的 值 .但 可 以 估计 和 式 的 上 界 . 这 个 上 界 对 某 些 算法 分 
析 过 程 也 是 有 用 的 .为 了 估计 和 式 的 上 界 , 可 以 使 用 放大 的 方法 ,就 是 将 数列 中 的 某 些 项 放 
大 ,以 使 得 数列 变 成 一 个 类 似 于 等 比 或 等 差 数 列 等 基本 数列 的 形式 ,然后 再 求 和 . 当然 ,这 样 
求 得 的 和 是 一 个 上 界 . 

估计 和 式 上 界 的 第 一 种 放大 法 就 是 用 序列 中 的 最 大 项 代替 序列 中 的 每 个 项 ,这 种 方法 


可 以 表示 为 Sa 三 namax. 这 种 方法 虽然 简单 ,但 是 放大 后 求 得 的 和 可 能 与 原来 数列 的 和 
k=1 


差距 太 大 . 如 果 放 大 后 所 求 得 和 函数 的 渐 近 的 界 仍 旧 保 持 不 变 , 这 种 放大 还 是 有 用 的 . 
另 一 种 放大 方法 要 用 到 等 比 级 数 . 假设 存在 常数 "二 1 ,使 得 arti/ar 二 7 对 一 切 k 宇 0 成 
立 , 那 么 有 


So os > ao 六 = a SN 一 过 本 
k=0 k=0 T= 


k=0 


例 1.8 估计 到 的 上 界 . 
k=1 


k si 
解 由 四 一 委 ,orr 一 全 村 得 


从 而 得 到 


除了 用 放大 的 方法 估计 和 式 上 界外 ,还 可 以 利用 积分 来 求 出 和 式 渐 近 的 紧 的 界 . 调和 级 
数 和 的 近似 值 就 是 这 样 求 得 的 . 

例 1.9 估计 > 二 的 渐 近 的 界 . 

解 ”调和 级 数 的 和 可 以 用 积分 作为 它 的 渐 近 的 界 ,下 界 与 上 界 的 积分 分 别 是 ， 


ol 十 de 
| 室 = In 十 D) 
| tL de ; 

饼 天 1 十 包 <1 = lnz 十 1 
图 1.2 给 出 了 这 两 个 积分 的 图 示 . 其 中 第 一 个 图 代表 下 界 图 中 的 阴影 面积 恰好 等 了 
左边 的 和 式 ; 第 二 个 图 代表 上 界 , 图 中 的 阴影 面积 与 左边 的 和 式 相 差 1. 根据 上 面 的 分 析 
得 到 


n 


Le 
> 万 一 elogn) 


k=1 


才 一 加 
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图 1.2 调和 级 数 求 和 的 积分 近似 


1.3.3 遂 推 方程 求解 方法 
递归 算法 的 分 析 离 不 开 递 推 方程 的 求解 . 本 节 先 给 出 递 推 方程 的 定义 ,然后 说 明 一 些 常 
用 的 求解 方法 ,有 关 求 解 方法 的 正确 性 证 明和 应 用 可 以 参考 文献 [1]. 
定义 1.2 设 序列 oo,a ,…',av,…，* 简 记 为 fa,} ,一 个 把 a, 与 某 些 个 ai;(i 二 n) 联 系 起 来 
的 等 式 叫 做 关于 序列 {a,) 的 递 推 方 程 . 请 看 下 面 的 例子 . 
例 1.10 Hanoi 塔 。 
图 1.3 中 有 A、B.C 三根 柱子 ,在 A 柱 上 放 着 n 个 圆 盘 ( 图 中 的 n==3) ,其 中 小 圆 盘 放 在 
[ | | 大 圆 盘 的 上 边 . 从 A 柱 将 这 些 圆 盘 移 到 C 柱 上 去 . 把 一 个 圆 
他 


盘 从 一 根 柱子 移 到 另 一 根 柱子 称 作 1 次 移动 ,在 移动 和 放置 
4 B 时 允许 使 用 B 柱 .但 不 允许 大 圆 盘 放 到 小 圆 盘 的 上 面 . 问 把 所 
图 1.3 ”Hanoi 塔 有 的 圆 盘 从 A 柱 移 到 C 柱 总 计 需 要 多 少 次 移动 ? 
一 种 递归 的 求解 方法 是 分 三 步 解 决 这 个 问题 . 第 一 步 使 
用 同样 的 方法 将 "一 1 个 盘子 从 A 柱 移 到 B 柱 ;第 二 步 利用 1 次 移动 将 最 下 面 的 大 盘子 从 
A 柱 移 到 C 柱 ; 第 三 步 还 是 用 第 一 步 的 方法 将 B 柱 上 的 nn 一 1 个 盘子 移 到 C 柱 , 用 伪 码 描述 
如 下 : 


算法 1.3 Hanoi(A,C.n) // 将 A 柱 上 的 个 盘子 按照 要 求 移 到 C 柱 上 
1. if n=1 then move (A,C) // 将 A 柱 上 的 1 个 盘子 移 到 C 柱 上 

2. else Hanoi(A,B,n—1) 

葡 move(A,C) 

4. Hanoi(B,C,n—1) 


使 用 上 述 算法 将 nn 个 盘子 从 A 柱 移 到 C 柱 且 不 允许 大 盘 放 到 小 盘 上 面 , 设 算法 总 的 移 
动 次 数 为 T(n) , 行 2 与 行 4 有 两 次 递归 调用 .每 次 调用 的 输入 实例 规模 是 一 1, 因 此 移动 
次 数 为 T(n 一 1), 行 3 有 1 次 移动 ,从 而 得 到 如 下 递 推 方程 : 

T(n) 一 2T(2 一 1) 十 1 

这 个 方程 的 初 值 是 T(1) 王 1. 后 面 将 证 明 这 个 方程 的 解 是 T(z) 一 2" 一 1. 
这 个 问题 就 是 著名 的 Hanoi 塔 问题 ,据说 古代 的 僧侣 按照 这 种 方法 移动 64 个 金 盘子 ， 
他 们 认为 当 64 个 金 盘 子 全 部 移动 完毕 ,世界 末日 就 到 了 . 下 面 计 算 一 下 移动 时 间 . 如 果 每 秒 
钟 移动 1 次 ,那么 64 个 盘子 需要 2% 一 1 一 18 446 744 073 709 551 615 秒 , 大 约 是 5000 亿 年 . 
对 于 Hanoi 塔 问 题 ,盘子 的 个 数 代表 问题 的 实例 规模 .TG0) 代 表 求 解 规模 为 n 的 问题 所 做 的 
基本 运算 移动 的 次 数 . 它 是 这 个 算法 的 时 间 复 杂 度 函数 . 对 于 Hanoi 塔 问 题 ,算法 1. 3 
的 时 间 复 杂 度 函数 T(n) 是 n 的 指数 函数 . 正如 上 面 的 计算 所 显示 的 ,即使 1 秒 钟 移动 


基础 知识 


1 亿 次 ,64 个 盘子 也 需要 5000 年 的 时 间 . 对 于 Hanoi 塔 问题 , 可 以 证 明 不 存在 多 项 式 时 间 
的 算法 . 因此 这 是 一 个 难 解 的 问题 . 

例 1.11 在 计算 机 中 经 常 需要 对 数据 进行 排序 ,下 面 给 出 两 种 排序 算法 , 即 插入 排序 
算法 InsertSort 与 二 分 归并 排序 算法 MergeSort. 试 确定 哪 种 排序 算法 在 最 坏 情 况 下 的 时 
间 复 杂 度 比较 低 . 为 简单 起 见 ,不 妨 设 输入 是 nn 个 不 同 的 数 构 成 的 数组 A[1..n], 其 中 
nn 二 2* ,kk 为 正 整 数 . 

先 考虑 插入 算法 . 假设 前 j 一 1 个 数 已 经 排 好 ,考虑 第 j 个 数 A[ 门 插入 的 位 置 . 从 第 
j 一 1 个 数 开始 ,从 后 向 前 ,顺序 将 A[j] 与 已 经 排 好 的 数 进行 比较 ,直到 找到 第 j 个 数 应 该 放 
置 的 适当 位 置 , 然 后 插入 第 j 个 数 . 算法 开始 时 j 等 于 2, 每 当 上 述 过 程 完成 后 j 增加 1, 直 
到 7 一 的 过 程 完成 为 止 .用 伪 码 描述 如 下 : 

算法 1.4 InsertSort(A,n) 

输入 : nn 个 数 的 数组 A 

输出 : 按照 递增 顺序 排 好 序 的 数组 A 


1. for j<-2 ton do 
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Sw AGI 

1 wt // 行 3 到 行 7 把 A[j] 插 入 A[1..j 一 1 之 中 
4 while i>0 and r=A[i] do 

油 A[i+1]<—A[] 

6 ii 一 1 

甩 A[i+1]<—zx 


设 W(n) 表 示 顺 序 插入 算法 InsertSort 对 于 规模 为 n 的 输入 在 最 坏 情况 下 所 做 的 比较 
次 数 . 如 果 ”一 1 个 数 已 经 排 好 ,为 插入 第 n 个 数 ,最 坏 情况 下 需要 将 它 与 前 n 一 1 个 数 中 的 
每 一 个 都 进行 1 次 比较 ,因此 得 到 递 推 方程 

Ww = We I 1 
W(1)=0 


后 面 的 求解 显示 W(n) 二 n(n 一 1)/2 二 O(n ). 

下 面 考虑 二 分 归并 排序 算法 MergeSort. 它 的 设计 思想 是 : 将 被 排序 的 数组 分 成 相等 
的 两 个 子 数组 ,然后 使 用 同样 的 算法 对 两 个 子 数组 分 别 排序 ,最 后 将 两 个 排 好 序 的 子 数组 归 
并 成 一 个 数组 . 例如 对 8 个 数 的 数组 工 进行 排序 , 先 将 工 划分 成 工 L1..4] 和 二 [5..8] 两 个 子 
数组 ,然后 分 别 对 这 两 个 子 数组 进行 排序 . 子 数 组 的 排序 方法 与 原来 数组 的 方法 一 样 ,以 
LL[L1..4] 的 排序 为 例 , 先 将 L[1..4] 划 分 成 L[1..2] 和 工 [3..4J 两 个 更 小 的 子 数组 ,分 别 对 它们 
排序 ,然后 进行 归并 . 当 对 更 小 的 子 数组 L[1..2] 进 行 排序 时 ,按照 算法 需要 进一步 划分 . 划 
结果 是 L[1] 和 LL[2]. 各 含有 1 个 元 素 ,不 再 需要 排序 . 这 时 算法 将 停止 递归 调用 并 开始 
归并 . 对 于 其 他 的 子 问题 ,算法 也 同样 处 理 . 算法 MergeSort 的 伪 码 描述 如 下 : 


算法 1.5 MergeSort(A,p,r) 

输入 : 数组 A[p..r]，1<p<r<n 

输出 : 从 A[pj] 到 A[ 门 按照 递增 顺序 排 好 序 的 数组 A 
1. if p<r 

2. then gl(p+r)/2] 
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3 MergeSort(A,p,g) 
4. MergeSort(A,g+1,7) 
5. Merge(A,p.g.r) 


其 中 Merge(A,p,q,7) 将 两 个 排 好 序 的 小 数组 A[p..gj] 与 ALg 十 1..7] 合 并 成 一 个 排 好 
序 的 大 数组 . 归并 的 基本 思想 是 : 将 这 两 个 小 数组 分 别 复制 到 B 与 C 中 ,A 变 成 空 数组 ,用 
来 存放 排 好 序 的 大 数组 . 接着 ,算法 比较 B 与 C 的 首 元 素 ,如 果 哪 个 首 元 素 较 小 ,就 把 它 移 
到 A 中 .比较 1 次 , 移 走 B 或 者 C 的 1 个 元 素 . 如果 B 或 者 C 中 的 一 个 变 成 空 数组 ,那么 就 
把 另 一 个 数组 剩 下 的 所 有 元 素 顺序 复制 到 A 中 . 用 伪 码 描述 ,过 程 如 下 : 

算法 1.6 Merge(A,p,q,7) 

输入 : 按照 递增 顺序 排 好 序 的 数组 A[p..qj 与 A[g 十 1..7] 

输出 : 按照 递增 顺序 排序 的 数组 AL2. . 门 

1. xz<dg 一 6 十 1，y< 一 r 一 4 //z,y 分 别 为 划分 后 两 个 子 数 组 的 元 素数 


2. 将 A[p..qj 复 制 到 B[1..z], 将 A[o 十 1.. 门 复制 到 C[1..y] 

3 tls fly hp 

4. While i<x and j<y do 

5. if B[i<CL] //B 的 首 元 素 不 大 于 C 的 首 元 素 
6. then A[kJ<-B[] // 将 B 的 首 元 素 放 到 A 中 
7 ii 十 1 

8 else 

9 A[LkJ<-CLj] 

10. Ji 十 1 

11. A< A 十 1 

12. if i>xz then 将 C[j..yj 复 制 到 A[k..r] //B 已 经 是 空 数组 

13. else 将 B[i..zj 复 制 到 A[k..r] //C 已 经 是 空 数组 


对 A[1..n] 排 序 直 接 调 用 MergeSort(A,1,n) 即 可 .不妨 设 n= 二 2 ,k 为 自然 数 .根据 上 
面 的 分 析 , 算 法 1. 5 中 的 行 3 与 行 4 是 对 输入 实例 规模 为 n/2 的 两 个 子 问题 的 递归 调用 ;从 
第 5 行 开始 是 算法 1.6 的 合并 过 程 ,这 个 过 程 最 坏 情况 下 需要 nn 一 1 次 比较 运算 . 设 W(n) 表 
示 二 分 归并 排序 算法 在 最 坏 情 况 下 所 做 的 比较 次 数 . 那 么 W(n) 满 足 如 下 递归 方程 : 

W(n) 一 2W(Ca/2) 十 2 一 1 

(a; =0 
从 后 面 的 求解 过 程 可 以 知道 ,上 述 弟 推 方程 的 解 是 W(n) 二 O(nlogn). 与 顺序 插入 算法 比 
较 , 显 然 二 分 归并 算法 的 复杂 度 函 数 的 阶 较 低 , 因 此 二 分 归并 算法 在 最 坏 情 况 下 比 顺序 插入 
算法 效率 更 高 . 

从 这 两 个 简单 的 例子 ,已 经 看 到 递 推 方程 在 算法 分 析 中 的 重要 作用 . 下 面 讨论 一 些 递 推 
方程 的 求解 方法 . 

和 迭代 归纳 法 是 常用 的 方法 之 一 .所 谓 和 迭代 就 是 从 原始 递 推 方程 开始 ,反复 将 对 应 于 递 推 
方程 左边 的 函数 用 右边 的 等 式 代 入 ,直到 得 到 初 值 .然后 将 所 得 的 结果 进行 化 简 . 为 了 保证 
结果 的 正确 性 ,往往 需要 代入 原来 的 递 推 方程 进行 验证 . 下 面 用 和 迭代 归纳 法 求解 关于 搬 和 人 排 
序 和 二 分 归并 排序 算法 时 间 复 杂 度 函数 的 递 推 方程 . 

例 1.12 用 和 迭代 归纳 法 求解 以 下 递 推 方程 : 


8 W(n)=W(n—1)+1 
(ao 


Hn—1 


步 迭 代 ) 
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i etal 
W()=0 

解 

(1) WO0)=W(n—1)+n—1 
[WG 一 2) 二 n 一 2J] 十 n 一 1==W(n 一 2) 十 (n 一 2) 十 (n 一 1]) ( 
[W(n—3) 二 +n—3J 二 (Cn—2)++Cn—1) 
Wn T= 
二 和 十 外 上 二 二 (一 抄 十 二 一 协 
1 十 2 十 … 十 (n 一 2) 十 (n 一 1) (代入 初 值 W(1)==0) 

=n(n—1)/2 
下 面 对 解 进行 归纳 验证 . 
n 二 1 时 有 W(1)==1X (1 一 1)/2==0, 与 给 定 初 值 符合 . 假设 对 于 nn 有 Wn) 二 n(n 一 1)/2, 那 么 


| 


三 (2 十 1) 


n(n 


1972 


n= (n+ 


W(m)+n 


从 而 证 明了 W(n) 二 n(n 一 1)/2 是 原 递 推 方程 的 解 . 
(2) Wn)=2W(2"!1)+2*—1 
一 2[2W (2 和 7) 十 2 和 一 匡 十 2 一 1 


= WD = 
二 322 的 二 六 说 一 相生 2 一 2 上 2 
PA | 


一 24W(1) 十 424 一 (2 十 2 十 … 十 2 十 1) 


一 上 2 一 2 十 1 
二 nlogn 一 nn 十 


n 


对 结果 进行 归纳 验证 .把 n=1 代入 上 述 公式 得 
W(1)=1°.logl—1+1=0 
符合 初始 条 件 . 将 结果 代入 原 递 推 方程 的 右边 得 


2 一 
pi Bn | 


下 


2*(k 


1) 


= 


W(n) 


这 说 明 得 到 的 解 满足 原来 的 递 推 方程 . 


例 1.13 


T(1)=1 


nlogn 一 nn 二 1 


用 迭代 法 求解 关于 Hanoi 塔 算法 的 递 推 方程 . 
ee =2T(n—J)++1 


1)n/2 


圳 一 恰 
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解 T(n)==2T(n 一 1]) 十 1 二 2[2T(n 一 2) 十 1 十 1 二 22T(n 一 2) 十 2 十 1 
2 区 T 全 一动 寺 吉 村 2 和 二 入 下 全 一 描 寺 入 二 21 


一 到 人 寺 2 十 六 -十 二 多 
一 2 十 2 十 2" 十 … 十 2 十 1 一 2" 一 1 
归纳 验证 与 前 面 类 似 , 在 此 不 再 缆 述 . 
迭代 方法 一 般 适 用 于 一 阶 的 递 推 方程 . 对 于 二 阶 以 上 , 即 T(n) 依 赖 于 它 前 面 更 多 个 项 
的 递 推 方程 ,直接 迭代 将 导致 迭代 后 的 项 太 多 ,从 而 使 得 求 和 公式 过 于 复杂 ,因此 需要 先 把 
递 推 方程 化 简 ,然后 再 进行 迭代 . 使 用 差 消 法 可 以 将 某 些 高 阶 递 推 方 程 化 简 为 一 阶 递 推 方程 . 
下 面 的 例子 是 关于 快速 排序 算法 平均 情况 下 时 间 复 杂 度 T(n) 的 递 推 方程 ( 见 第 2. 4. 1 节 ). 
T() 依 赖 于 Tn 一 1),，T(n 一 2),…,T(1),T(0) 等 所 有 的 项 ,这 种 递 推 方程 也 称 为 全 部 历史 递 
推 方 程 . 由 于 T(0) 二 0, 可 以 把 这 一 项 从 方程 中 删 去 ,从 而 得 到 下 面 的 方程 . 求解 过 程 如 下 . 
例 1.14 求解 下 述 递 推 方程 : 


nl 
二 
n i=1 


T(1) 一 0 
解 由 原 方程 得 到 


1 
nT(n) = 22) TO) +n —n 
i=] 


m2 
人 一 DT 一 1D) 一 22>)TGD) 十 (一 1 一 (2 一 1) 
第 一人 


将 两 个 方程 相 减 得 到 
一 人 一 DT 一 攻 一 2 一 切 二 加 一 和 


化 简 得 到 
nT(n) 售 寺 TUR 一 0 于 28 一 过 
变形 并 迭代 得 到 
TO TO 一 1 ， 和 一 2 
和 n nn 二 1) 
a 


括号 内 恰好 为 调和 级 数 之 和 . 根据 前 面 的 例 1.9, 这 个 和 是 (logn) ,因此 得 到 原 递 推 方程 的 
解 T(n) 二 9(nlogn). 
上 面 的 例子 说 明 , 许 多 递 推 方 程 不 能 求 出 精确 的 解 ,但 是 可 以 估计 出 函数 的 阶 ,这 对 于 


算法 分 析 工 作 是 有 意义 的 . 
用 递归 树 的 模型 可 以 说 明 上 述 选 代 的 思想 . 下面 以 二 分 归并 排序 算法 的 递 推 方程 
W(n) 一 2W(Cz/2) 十 7 一 1 n= 2 
的 一 0 


为 例 来 构造 递归 树 . 
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递归 树 是 一 棵 结 点 带 权 的 二 叉 树 . 初始 的 递归 树 只 有 一 个 结 点 , 它 的 权 标 记 为 W (n). 
然后 不 断 进行 迭代 ,直到 树 中 不 再 含有 权 为 函数 的 结 点 为 止 . 迭代 规则 就 是 把 递归 树 中 权 为 
函数 的 结 点 ,如 WO) ,Wln/2),W(n/4),…, 用 和 这 个 函数 相等 的 递 推 方程 右 部 的 子 树 来 
代替 . 这 种 子 树 只 有 2 层 , 树 根 标记 为 方程 右 部 除了 函数 外 的 剩余 表达 式 , 每 一 片 树叶 则 代 
表 方 程 右 部 的 一 个 递归 的 函数 项 . 例如 第 一 步 迭 代 ,. 树 中 唯一 的 结 点 (第 0 层 )W() 可 以 用 
根 是 ”一 1、2 片 树叶 都 是 W(m/2) 的 子 树 来 代 蔡 . 代替 以 后 递归 树 由 1 层 变 成 了 2 层 . 第 二 步 
和 迭代 ,应 该 用 根 为 w/2 一 1、2 片 树叶 都 是 W(m/4) 的 子 树 来 代替 树 中 权 为 W(n/2) 的 叶 结 点 
(第 1 层 ) ,代替 后 递归 树 就 变 成 了 3 层 . 照 这 样 进行 下 去 ,每 迭代 一 次 ,递归 树 就 增加 一 层 ， 
总 共和 迭代 A 一 1 次 ,直到 树叶 都 变 成 W(2) 二 1 为止. 整个 迭代 过 程 与 递归 树 的 生成 过 程 完 全 
对 应 起 来 ,正如 图 1.4 所 示 . 不 难看 出 ,在 整个 迭代 过 程 中 递归 树 中 全 部 结 点 的 权 之 和 不 变 ， 
总 是 等 于 函数 W(n). 

为 了 计算 最 终 的 递归 树 中 所 有 结 点 的 权 之 和 ,可 以 采用 分 层 计 算 的 方法 . 递归 树 有 
& 层 ,各 层 结 点 的 值 之 和 分 别 为 


下 一 1 一 2 一 4 一 2 和 


因此 总 和 为 


1 一 (1 十 2 十 … 十 2 和 1) = 二 nk 一 (2: 一 1) = 二 nlogn 一 n 十 1 
不 难看 出 ,这 个 结果 与 例 1. 12 的 结果 完全 一 致 . 

对 于 某 些 递 推 方程 ,由 于 右边 的 两 个 项 不 一 样 , 不 能 合并 . 如 果 用 和 迭代 归纳 法 求解 ,每 迭 
代 1 次 ,就 出 来 至 少 两 个 不 同 的 项 ,迭代 次 以 后 就 会 出 来 2* 个 不 同形 式 的 项 ,这 对 于 求 和 
不 是 很 方便 的 . 在 这 种 情况 下 ,用 递归 树 的 方法 更 加 直观 . 请 见 例 1. 15. 

例 1.15 求解 递 推 方程 


T(n) = T(z/3) 十 T(27z/3) 十 交 
解 ” 这 个 方程 右边 的 项 分 别 为 T(x/3) 与 T(2n/3), 它 的 递归 树 如 图 1. 5 所 示 . 


n n 
一 1 一 1 
Wn) ba RR ss WW 

mw) we) -1 弛 1 91 -1 m2 也 2n 六 

2 2 次 人 fn Sn i py pi -4 pg 入 
而 本 LAA 玫 了 和 

E 9 99 9 

让 O(nlogn) 

图 1.4 递归 树 图 1.5 递归 树 


这 棵 递归 树 的 树叶 不 在 同一 层 上 . 从 树 根 出 发 直到 树叶 ,最 左边 的 路 径 是 最 短 的 路 径 ， 
每 走 一 步 ,问题 规模 就 减少 为 原来 的 1/3; 最 右边 的 路 径 是 最 长 的 路 径 , 每 走 一 步 ,问题 规模 
减少 为 原来 的 2/3. 在 最 坏 情 况 下 ,考虑 最 长 的 路 径 . 假设 递 推 方程 的 初 值 为 1( 如 果 设 其 他 
常数 作为 初 值 , 解 的 阶 仍旧 不 变 ) ,最 长 路 径 的 长 度 是 ,那么 有 


区 六 本 :证 
中 3 ) l=>n ( 2 ) k = logs/an 


因此 这 棵 递归 树 有 logs/n 层 . 因为 每 层 结 点 的 数值 之 和 都 为 O(n) ,从 而 得 到 
T(n) = O(nlogs2n) = O(nlogn) 
估计 递 推 方程 解 的 阶 ,也 可 以 使 用 尝试 的 方法 . 这 种 方法 的 基本 思想 就 是 先 猜想 解 是 哪 
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种 类 型 的 函数 ,给 出 这 个 函数 表达 式 的 一 般 形 式 ,在 这 个 表达 式 中 可 能 含有 某 些 待定 参数 ， 


然后 将 这 个 函数 代入 原 递 推 方程 以 确定 这 些 参 数 的 值 . 
Pp 的 递 推 方程 可 以 写成 下 述 形式 ,现在 使 用 尝试 法 求解 . 


例 1.14 
| 
Ti 二 三 >)TCD + OG) 


如 果 首 先 猜想 TT(n) 一 C 为 常 函 数 ,代入 原 递 推 方程 得 到 
左边 = O(C1) 
右边 = Cn— 1) 十 O(z) = 2C— 2 +O0) = O(n) 
布 边 为 一 次 函数 ,左边 为 常 函 数 ,右边 的 阶 高 于 左边 的 阶 ,显然 函数 设 定 不 合适 . 
接着 设 T(n) 为 一 次 函数 , 即 T(n) 二 cn,c 为 某 个 常数 ,那么 
左边 一 cn 
右边 = 2 ci HOCa) = 芭 于 FO) = cn —e+ On) 
两 边 最 高 次 项 是 nn 的 1 次 项 ,但 O(w) 含 有 nn 的 1 次 项 ,因此 右边 1 次 项 的 系数 大 于 左边 的 
系数 . 这 个 解 仍旧 不 满足 方程 . 
下 面 尝 试 T(n) 二 cn? ,cc 为 某 个 常数 ,代入 得 到 
左边 一 cz 
右边 2 Doerr a 2 [ 竺 FO0)]+ OO Bo FO0 
右边 2 次 项 的 系数 小 于 左边 2 次 项 的 系数 .这 个 解 也 不 对 . 于 是 猜想 T(z) 的 阶 应 该 介 于 en 


和 cn? 之 间 . 
下 面 设 TGz) 一 czlogz，c 为 某 个 常数 ,代入 得 到 


左边 = cnlogn 
DN 2c | n? 
右边 二 地 之 iog HO) 一 也 上 及 ogn 一 下 ow] HO 


= cnlogn+t O(n) 
上 时 左边 和 右边 的 最 高 次 项 . 即 nlogn 项 的 系数 都 是 cc, 因此 函数 T(n) 二 cnlogn 二 B(nlogn) 


这 
1 是 方程 的 解 . 
ma 在 上 面 的 求 和 过 程 中 也 使 用 了 积分 近似 ,上 界 的 近似 如 图 1. 6 
FF 和 式 og 满足 
i=1 


所 示 , 阴 影 部 分 的 面积 等 


ol 
Dilogi < | logzrdz 
i=1 2 
而 计算 积分 可 得 到 
i Lia 
i | logzdz 人 zlnz dz ll 了 lnz 了 ] 
Oo 
7 L (Gl ) LL ( a ln2 4 ) 
lIn2\ 2 4 ln2\ 2 4 
NS 入 7 
> yilogi = 本 区 本 一 和 


234 n-ln 
图 1.6 积分 近似 


i=l 
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不 难看 出 ,对 于 上 述 递 推 方程 ,使 用 尝试 法 得 到 的 解 与 使 用 迭代 法 得 到 的 解 完全 一 样 . 

最 后 ,介绍 一 个 重要 的 定理 一 一 主 定理 , 它 直 接 给 出 了 某 些 常用 递 推 方程 的 解 . 

定理 1.6 主 定理 (MasterTheorem) 设 < 三 1.0 二 1 为 常数 ,f(n) 为 函数 ,T(n) 为 非 负 
整数 , 且 


第 
| 
章 


T(n) = aT(n/b) + fn) 
则 有 以 下 结果 : 
(1) 若 FFC) 一 OCae" ) ,es 二 0 那么 T(z) 一 BCzaew" ) 
(2) 车 fl) 二 Bw%), 那 么 T(n) 二 O(n*% logn) 
(3) 车 f(n) 二 QCneeetr),e 放 0, 且 对 于 某 个 常数 c 二 1 和 所 有 充分 大 的 nw 有 af(n/5b) 三 
ca) ,那么 T(n) 二 9(f(n)). 
证 ”不妨 设 "一 多 ,经 过 和 迭代 得 到 


Tn) aT( 呈 1 fn) a[aT( 菇 + /(2¥)] + fn) 


=a 2 J+/( 双 J 


eT( 共有 er( 襄 让 | a (2 ) fn) 


-eT + 多 7 人 (车 ] 


cunt + eif (路) T(D)=a 
(1) 第 一 种 情况 ,f02) 二 OG) 
log,n—1 


La logpa—e 
ToD =anme 二 Def (六 = +O( 如 w( 癌 ) 


er 
logsn 一 1 logpn—1 

=c1nlme +0 (nm 党 ey = vivi 4 Oe 2 CHP) 
j=0 Pr 


Dblogp™ 一 1 
Wo 
(2) 第 二 种 情况 , 即 f() 一 BCzg" ) 


ci7zlogse 十 O(n ) cin®®%® 十 Ons en’) 一 Ons ) 


logyn—1 ee 
T(n) =cinee 十 Sa 佑 )= Cin B® +e( Dia i | 
j=0 
owl 
二 Cin 十 @ (nm 党 5]= Cine® + On logn) 
j=0 
=Q(n% logn) 
(3) 第 三 种 情况 , 即 f(7) 二 QCno%+) 
logsn—1 
TO) 一 Gaow 十 到 cy/ 傍 j cine%e 十 站 of n) (af( 驻 a co】 
j=0 


comn — 1 
= 


二 cn 十 f(D) 一 一 一 二 an%% 十 @(f(n)) (c=1) 
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三 上 (Fn (fln) 三 站 (meet)) 
显然 T(n) 宇 f(n) ,于 是 得 到 TOz) 一 BCFCz) ). 
下 面 针 对 主 定理 的 三 种 情况 分 别 给 出 求解 的 例子 . 
例 1.16 求解 递 推 方程 
T(n) = 9T(n/3)+n 
解 上述 递 推 方程 中 的 < 一 9.0 一 3, /Co) 一 2 那么 
We = la) = OD 
旦 相当 于 主 定理 的 第 一 种 情况 ,其 中 二 1. 根据 定理 得 到 T(n) 二 8@(n) 
例 1.17 求解 递 推 方程 


T(n) = T(2n/3)+1 
解 上 述 弟 推 方程 中 的 a=1,6 二 3/2,f(m) 二 1, 那 么 
n= 1 f=1 
这 里 相当 于 主 定理 的 第 二 种 情况 . 根据 定理 得 到 T(z) 一 B(z"logz) 一 9(logz). 
例 1.18 求解 递 推 方程 
T(n) = 3T(n/4) + nlogn 
解 上 述 递 推 方 程 中 的 a==3.6 二 4,/(n) 二 nlogn, 那 么 
pl = 人 (way = Ds. es 02 


此 外 ,要 使 af(n/) 三 cf (7 成立, 代入 f(x) 二 nlogn, 得 到 
Plog 村 < cnlogn 


显然 只 要 c 三 3/4, 上 述 不 等 式 就 可 以 对 充分 大 的 nn 成立 . 这 里 相当 于 主 定理 的 第 三 种 情况 . 
因此 有 T() = 二 8(/(n)) 二 8B(nlogn). 

特别 需要 说 明 的 是 ,在 第 一 种 情况 与 第 三 种 情况 的 条 件 中 需要 存在 一 个 大 于 0 的 数 s. 
注意 ze" 一 或 mw 与 mw 的 阶 是 不 一 样 的 . 考查 下 面 的 例子 . 

例 1.19 求解 以 下 递 推 方程 : 

T(n) = 2T(n/2) + nlogn 

在 第 2 章 关 于 最 临近 点 对 问题 的 分 治 算法 设计 与 分 析 中 ,这 个 方程 是 关于 最 坏 情 况 下 
时 间 复 杂 度 函数 的 递 推 方程 . 不 难看 到 a 二 6 二 2,f(n) 二 nlogn, 从 而 得 到 me? 一 2 而 
(nn) 二 nlogn 的 阶 比 的 阶 高 ,似乎 应 该 属于 主 定理 的 第 三 种 情况 . 但 是 , 找 不 到 正 数 e 二 0 
使 得 nlogn 二 QCGm*) 成 立 , 因 为 logn 的 阶 低 于 任何 宪 函 数 n* 的 阶 .于 是 ,这 个 递 推 方程 不 满 
足 主 定理 的 条 件 , 因 此 不 能 使 用 主 定理 求解 . 下 面 使 用 递归 树 的 方法 求解 . 

解 ” 为 简单 起 见 , 不 妨 设 n 二 2*, 递 推 方程 (nn) 二 2T(n/2) 十 nlogn 的 递归 树 如 图 1.7 
所 示 . 


nlogn nlogn 
n(logn—1) n(logn—1) 了 
一 这 Woe 
(I % 2) nll # 滋 2) 
n(logn—2. og n(logn—2, og 3 
4 4 4 4 bs) 


图 1.7 递归 树 


基础 知识 


该 方程 的 解 为 
T(n) =nlogn+n(logn—1)++n(logn—2) 二 *… 十 n(logn 一 k 十 1) 
二 (nlogn)logn 一 n(1 十 2 十 … 十 k 一 1) 
nlog:n—nk(k—1)/2 = O(nlog:n) 
注意 在 上 面 的 公式 中 log*n 是 (logn)? 的 简单 表示 . 

在 递归 算法 的 时 间 复 杂 度 分 析 中 常常 用 到 主 定理 ,其 中 a 代表 递归 调用 所 产生 的 子 问 
题 个 数 ,n/b 代表 这 些 子 问题 的 规模 ,f(n) 则 代表 调用 前 的 操作 及 调用 后 把 子 问题 的 解 组 合 
成 原 问题 的 解 的 总 工作 量 . 比如 二 分 检索 算法 ,经 过 1 次 比较 就 产生 1 个 规模 减 半 的 子 问 
题 ,因此 a 二 1,6 二 2,f(n) 二 1; 二 分 归并 排序 算法 需要 对 两 个 规模 减 半 的 数组 进行 调用 ,而 
调用 后 的 归并 工作 量 是 n 一 1, 因 此 a 二 2,6 二 2,/(n) 二 O(m). 更 多 的 应 用 例子 将 在 第 2 章 
给 出 ， 

在 某 些 递 推 方程 中 有 取 整 的 底 函 数 或 项 函数 . 对 于 这 种 方程 ,有 的 可 以 采用 尝试 法 来 求 
解 , 即 先 估计 解 的 表达 式 , 然 后 归纳 证 明 解 的 正确 性 . 考虑 下 面 的 例子 . 

例 1.20 求解 下 述 递 推 方程 


ee = 27(| 生 |+， 
T(1)=1 

解 ” 因为 递 推 方程 荆 (n) 二 2T(n/2) 十 n 的 解 是 O(nlogn), 即 存在 c 记 0, no 使 得 当 n 三 
m0 时 有 Tn) 志 cnlogn. 于 是 ,可 以 估计 原 递 推 方程 的 解 也 是 cnlogn(n 宇 2) ,下 面 进行 归纳 
证 明 . 

当 n= 二 2 有 T(2)==2T(1) 十 2==4, c2log2 二 2c, 只 要 c==2 就 有 T(2) 委 c2log2 成 立 ， 

假设 对 于 一 切 小 于 nn 的 自然 数 &，T(k) 三 cklogk 成 立 , 那 么 有 


TO) =2T (ln/2)+n<2T/2) +n<2eslog tn 


cn(logn—1)+n= cnlogn—cntn 
cnlogn—(c—ln<anlogn (c>1) 
综 上 所 述 , 只 要 c= 二 2, 对 一 切 n 都 有 T(n) 三 cnlogn 成 立 . 
以 上 简要 介绍 了 递 推 方 程 的 求解 方法 ,这 些 方法 在 第 2 章 有 关 分 治 算法 的 分 析 中 会 大 
量 用 到 . 


习 题 1 


1.1 设 A 是 n 个 不 等 的 数 的 数组 ,n 二 2. 以 比较 作为 基本 运算 , 试 给 出 一 个 O(1) 时 间 的 算 
法 找 出 A 中 一 个 既 不 是 最 大 也 不 是 最 小 的 数 . 写 出 算法 的 伪 码 ,说 明 该 算法 最 坏 情况 
下 执行 的 比较 次 数 . 

1.2 考虑 下 述 选择 排序 算法 : 
算法 ModSelectSort 


输入 : n 个 不 等 的 整数 的 数组 A[1..n] 
输出 : 按 递 增 次 序 排序 的 A 


才 一 如 
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1. fori<-1 to 7 一 1 do 
2. forj<i+l ton do 
娄 if A[j]=AL[i] then A[i]—=AL[L;] 


问 : 

(1) 最 坏 情 况 下 该 算法 做 多 少 次 比较 运算 ? 

(2) 最 坏 情况 下 该 算法 做 多 少 次 交换 运算 ? 这 种 情况 在 什么 输入 条 件 下 发 生 ? 

给 定 正 整数 的 数组 AL1.. 阅 ,测试 A 的 每 个 元 素 A[ 记 的 奇偶 性 . 如 果 A[ 门 是 奇数 , 则 

将 它 2 倍 后 输出 ;否则 直接 输出 A[. 

(1) 以 乘法 作为 基本 运算 ,使 用 大 O 记 号 ,还 是 使 用 大 9 记号 ,哪个 记号 能 够 正确 表达 
这 个 算法 对 于 规模 为 的 输入 所 做 的 基本 运算 次 数 ? 为 什么 ? 

(2) 如 果 以 元 素 的 测试 作为 基本 运算 ,重复 问题 (1). 

计算 下 述 算法 所 执行 的 加 法 次 数 . 


输入 : 2 一 2 ,， 1 为 正 整 数 


1. k<0 

2. while "二 1 do 

ki for jl ton do 
4. &< 十 1 

5 n<—n/2 

6 


. returnk 
计数 算法 C 所 执行 的 加 法 次 数 . 


算法 C 

输入 : 为 正 整数 
输出 : 人 

1, Re0 

2. for iltom do 

3 m=<—[n/i 
4. for jl1 to m do 
5 k<k 二 1 
6 


. returnk 


阅读 关于 下 述 算法 A 的 伪 码 .说 明 该 算法 求解 的 是 什么 问题 ,并 计算 该 算法 所 做 的 乘 
法 运算 (x* ) 和 加 法 运算 次 数 . 

算法 A 

输入 : 数组 P[0.. 站 ,实数 工 

输出 : y 

L 六 二 下 [oj power < 1 


2. fori < ltom do 


Sd: power <-power * Tt 
4. yy 十 PL[i] * power 
5. returny 


基础 知识 


1.7 下 述 Find-Second-Min 算法 是 找 第 二 小 算法 . 输入 是 个 不 等 的 数 构成 的 数组 S , 输 
出 是 第 二 小 的 数 SecondMin. 
(1) 在 最 坏 情 况 下 ,该 算法 做 多 少 次 比较 ? 
(2) 若 所 有 输入 是 等 概率 分 布 的 ,平均 情况 下 该 算法 做 多 少 次 比较 ? 
算法 Find-Second-Min(S,n) 

;证 下 寺 S12] 

. then min <—S[1]; SecondMin <-S[2] 

. else min <S[2]; SecondMin <—S[1] 

. fori<-3tondo 

if S[i] <SecondMin 

then if S[i] <min 
then SecondMin <—min; min <-S[i] 


else SecondMin <—S[i] 

1.8 已 知 二 是 含有 7 个 元 素 并 且 排 好 序 的 数组 ,zx 在 工 中 .如 果 xz 出 现在 L 中 第 i 个 (i 二 
2,3,… ,nn) 位 置 的 概率 是 在 前 一 个 位 置 概率 的 一 半 , 当 充分 大 时 ,估计 下 述 查 找 算法 
平均 情况 下 的 时 间 复 杂 度 A(m). 只 需 给 出 近似 值 . 


OIA 人 wn 


1. jl 

2. while j<n and xz>L[j] do 

3. j<j+l 

Pl 

5. then j<—0 

1.9 设 A 为 n 个 不 等 的 数 的 数组 .给 定 z, 若 z 在 A 中 ,输出 z 的 下 标 k; 若 z 不 在 A 中 ， 
输出 0. BinarySearch 和 LinearSearch 分 别 表示 二 分 和 顺序 搜索 ,设计 下 述 算 法 : 
算法 Search(A,z) 
1. fn 为 奇数 then A<-BinarySearch(A,z) 


2. else A< LinearSearch(A ,z) 


以 比较 作 基 本 运算 ,用 大 O 记号 表示 算法 在 最 坏 情况 下 的 时 间 复 杂 度 W(n); 能 否 使 
用 大 9 记号 表示 W(n)? 为 什么 ? 
1. 10 考虑 下 述 素 数 测试 算法 : 
算法 PrimalityTest(n) 
输入 : n,n 为 大 于 2 的 奇 整数 
输出 : true 或 者 false 
Pe Mn] 


1 

2. forj<2tos 

让 j7 整除 

1 then return false 
5, 


. return true 


(1) 假设 计算 [Yn 加 以 在 O(1) 时 间 完 成 ,估计 该 算法 在 最 坏 情况 下 的 时 间 复 杂 度 


击 一 器 
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1 


二 
LE 


1. 


L 


1 


12 
13 
14 


.15 


“16 


17 


18 


(2) 能 否 使 用 @ 符号 表示 这 个 算法 在 最 坏 情况 下 的 时 间 复 杂 度 ? 为 什么 ? 

证 明定 理 1.3: 假设 /和 g 是 定义 域 为 自然 数 集合 的 函数 , 若 对 某 个 其 他 函数 h, 有 
f= 二 O0(h) 和 g 二 O(h) 成 立 , 那 么 [十 g 二 Oh). 

证 明定 理 1. 4: 对 每 个 5 二 1 和 每 个 盖 0. 有 logsn 二 oCn*). 

证 明定 理 1. 5: 对 每 个 >1 和 每 个 d 盖 0. 有 妈 一 o( 普 ). 

设 z 为 实数 ,mn,a ,0 为 整数 ,证 明 下 述 性 质 : 

(1) xz—1<lzx kz<[z Kzt+l1 

(2) [zt+nd=Lrdtn,fzrtnl=[z Hn 


(3 | 到 |H 和 上 n 


i 


(4)| 5 可 


考虑 下 面 每 对 函数 /(n) 和 g(n) ,如 果 它 们 的 阶 相等 则 使 用 9 记号 ,否则 使 用 O 记 号 
表示 它们 的 关系 . 

(1) f() =n)/2,g(n)=6n 

(2) fn)=nt+2 Vn,gn)=n 

(3) f (0) =ntnlogn,g (mn) =nVn 

(4) f(1)=2log’n,g(n)=logn+t1 


1.05 


(5) f(n)=log(n!),g(n)=n 
在 表 1. 1 中 填 人 true 或 false. 


表 1.1 函数 了 与 8 


GD) gln) f=0(g800) | f0)=QCg00)) [Fo 一 BCgCo)) 
1 2723 十 37 10022 十 22 十 100 
2 507 十 logm 10n+ loglogn 
3 50nlogn l0nloglogn 
4 logn log°n 
5 nl 5" 


对 于 下 面 每 个 函数 /(n) ,用 9 符号 表示 成 /(n) 二 B(g(n)) 的 形式 ,其 中 g(n) 要 尽 可 
能 简洁 . 比如 Foz) 王 好 十 22 十 3 可 以 写 为 f(n) 二 8(n?). 然 后 ,按照 阶 递增 的 顺序 将 
这 些 函 数 进行 排列 . 

We= 0 gi 1007 和 2 二 0,00 十 SW 二 


Cla)? leny logtnlhs, let 1 二 言 十 … 十 二 


对 以 下 函数 ,按照 它们 的 阶 从 高 到 低 排 列 ; 如 果 f(x) 与 g(n) 的 阶 相等 ,表示 为 Fo) 一 
Ql(g(n)). 


2 ls > 十: ns om Bi Dem 
k=1 


1 19 


1.20 


1.21 


n’, log(n!), 


求解 以 下 递 推 方程 : 


本 《一半 


¢ bd 


logn, loglogz ， 7 


T(n)=9T(n/3)+n 


(2) 
TY=1 


T(n)=T(n/2) 二 
《3 
T(1)=1 


T01)=1 


T(n/4) 十 cn， < 为 常数 


T(n)=5T(n/2)++ (nlogn)’ 


(5) 
TU 一 1 


T(n)=2T(n/2)+ 
(6) 

T(1)=1 

T(n)=T(n—1)1 
(7) 

T(1)=1 


T(n)=T(n—1)++log3" 
(1) | 


Fn? logn 


Hl/n 


(8) TO)= 二 Tn 一 1) 十 logn, 估 计 Tw) 的 阶 . 
设 递 推 方程 (mn) 二 7T(n/2) 十 n? 给 出 了 算法 A 在 最 坏 情况 下 的 时 间 复 杂 度 函数 ， 
算法 B 在 最 坏 情况 下 的 时 间 复 杂 度 函数 W(n) 满 足 递 推 方程 W(n) 二 aW(n/4) 十 ne. 
试 确定 最 大 的 正 整 数 a 使 得 W(n) 的 阶 低 于 T(x) 的 阶 . 
设 原 问题 的 规模 是 nn, 从 下 述 三 个 算法 中 选择 一 个 最 坏 情况 下 时 间 复 杂 度 最 低 的 算 


法 ,简要 说 明理 由 . 


loglogn 


nl, 


77， 


log10” 


基础 知识 


算法 A: 将 原 问 题 划 分 规模 减 半 的 5 个 子 问题 ,递归 求解 每 个 子 问题 ,然后 在 线性 时 


间 将 子 问题 的 解 合 并 得 


到 原 问题 的 解 . 


算法 B: 先 递归 求解 2 个 规模 为 n 一 1 的 子 问 题 ,然后 在 常量 时 间 内 将 子 问 题 的 解 


合并 . 


算法 C: 将 原 问题 划分 规模 为 n/3 的 9 个 子 问题 ,递归 求解 每 个 子 问题 ,然后 在 
OQ) 时 间 将 子 问 题 的 解 合并 得 到 原 问题 的 解 . 


才 一 加 


时 


分 治 策略 (Divide and Conquer) 是 一 种 常用 的 算法 设计 技术 ,使 用 分 治 策略 设计 的 算法 
通常 是 递归 算法 . 


2.1 分 治 策略 的 基本 思想 


2.1.1 两 个 款 悉 的 例子 


先 看 两 个 熟悉 的 例子 : 二 分 查找 和 二 分 归并 排序 . 
在 一 个 排 好 序 的 数组 T[1..n] 中 查找 zx. 如 果 z 在 T 中 ,输出 xz 在 T 中 的 下 标 j; 如 果 
zz 不 在 T 中 ,输出 7 一 0. 使 用 下 述 二 分 查找 算法 . 


算法 2.1 BinarySearch(T,xz) 
输入 : 排 好 序 的 数组 T; 数 z 
输出 : j 

TY 

2. while /<r do 

3. me<L(+r)/2] 

4. if T[m]=x then return m // 代 恰好 等 于 中 位 元 素 
5 

6 

EE 


else if T[m]>x then rm—1 
else (<—m+1 


. return 0 


通过 > 与 数组 T 中 元 素 的 1 次 比较 .T 中 需要 检索 的 范围 至 少 减 半 , 因 此 检索 次 数 
W(n) 满 足下 述 递 推 方程 : 


Ee 一 w(| 季 |: 
W(1) 王 1 

根据 第 1 章 的 知识 ,可 以 解 出 W(n) 二 llognl4+1. 

回顾 第 1 章 提 到 的 二 分 归并 排序 算法 MergeSort. 它 的 设计 思想 是 : 将 被 排序 的 数组 分 
成 相等 的 两 个 子 数组 ,然后 使 用 同样 的 算法 对 两 个 子 数 组 分 别 排序 ,最 后 将 这 两 个 排 好 序 的 
子 数组 归并 成 一 个 排序 的 数组 . 假设 n= 二 2* ,那么 二 分 归并 排序 算法 时 间 复 杂 度 的 递 推 方 


程 是 : 
EE a 2W (到 +a 一 1 
W()=0 
且 W(n) 二 nlogn 一 n 十 1. 
上 面 两 个 算法 就 是 用 分 治 策略 设计 的 算法 .它们 的 共同 特点 是 : 将 规模 为 n 的 原 问题 
归 约 为 规模 减 半 的 子 问题 (可 以 是 一 个 子 问题 ,也 可 以 是 多 个 子 问 题 ). 分 别 求解 每 个 子 问 
题 , 然 后 把 子 问题 的 解 进行 综合 ,从 而 得 到 原 问题 的 解 . 
2.1.2 分 治 算 法 的 一 般 性 描述 
把 上 面 的 设计 思想 加 以 概括 ,可 以 得 到 分 治 算法 的 一 般 描 述 . 设 已 是 待 求解 的 问题 ， 
1P| 代 表 该 问题 的 输入 规模 ,一 般 的 分 治 算法 Divide-and-Conquer 的 伪 码 描述 如 下 : 


算法 2.2 Divide-and-Conquer(P) 


1. 让 |Pl<e then SCP) 

2. divide P into Pi ，P: ,…,P // 将 P 归 约 成 k 个子 问题 
3. for i=] tokdo 

4 weDivideand-Conquer(CP,) // 递 归 求 解 每 个 子 问题 

5. return Merge(y ，y ，… ,ye) // 把 子 问题 的 解 进行 综合 


上 述 伪 码 说 明 : 如 果 问 题 规模 不 超过 c( 在 上 述 二 分 检索 和 二 分 归并 排序 算法 中 c==1)， 
算法 停止 递归 ,直接 求解 P,S(P) 就 代表 直接 求解 的 过 程 ;否则 ,将 P 归 约 成 & 个 彼此 独立 
的 子 问题 Pi,P:,…, Ph. 然后 递归 地 依次 求解 这 些 子 问题 ,得 到 解 yj ,ys ,，… ,ys. 最 后 将 这 
k 个 解 归并 得 到 原 问题 的 解 ,Merge 代表 归并 子 问题 的 解 的 过 程 . 

分 治 算法 通常 都 是 递归 算法 ,这 种 算法 的 时 间 复 杂 度 分 析 通 常 需要 求解 递 推 方程 . 如 果 
原 问题 的 输入 规模 是 ,根据 上 面 的 伪 码 ,分 治 算法 时 间 复 杂 度 的 递 推 方程 的 一 般 形式 是 : 

W(ln) = W(| P 1)+W(| P: 1) 十 … 十 到 (| Pi |)+ fn) 

(res =C 
上 面 的 C 代表 直接 求解 规模 为 c 的 子 问题 的 工作 量 ,而 /Coz) 代 表 将 原 问题 归 约 为 若干 子 问 
题 以 及 将 子 问题 的 解 综合 为 原 问题 的 解 所 需要 的 总 工作 量 . 例如 二 分 检索 通过 1 次 比较 就 
将 原 问 题 归 约 为 规模 减 半 的 子 问 题 ,而 最 后 子 问题 的 解 就 是 原 问题 的 解 , 综 合 阶段 不 需要 和 额 
外 工作 ,因此 Fa 三 1. 二 分 归并 排序 的 划分 阶段 不 需要 工作 ,而 归并 两 个 子 问题 的 解 需要 
?一 1 次 比较 ,因此 f(n)==n 一 1. 

观察 上 面 的 递 推 方程 ,不 难 发 现 : 如 果子 问题 的 规模 都 一 样 ,方程 的 求解 比较 简单 . 这 
就 要 求 子 问题 的 划分 比较 均匀 . 同时 ,后 面 的 例子 将 表明 , 当 子 问题 的 划分 比较 均匀 时 ,时 间 
复杂 度 相 对 也 比较 低 . 


2.2 分 治 算法 的 分 析 技 术 


分 治 算法 通常 是 递归 算法 ,算法 时 间 复 杂 度 的 分 析 需 要 求解 递 推 方程 . 在 分 治 算法 中 最 
常见 的 递 推 方程 有 下 面 两 类 : 


摹 法 说 计 与 分 新 ( 2 版 ) 


k 
TO) = DaiT(n—id) + fon) 
i=1 


T(n) = aT (Eta 


如 果 归 约 后 的 子 问 题 规模 比 原 问题 呈现 常数 量 级 的 减少 ,就 会 得 到 第 一 类 递 推 方程 . 例 
如 ,Hanoi 塔 的 分 治 算法 ,将 区 个 盘子 的 移动 归 约 为 两 个 2 一 1 个 盘子 移动 的 子 问题 , 子 问题 
规模 只 比 原 问题 少 1, 于 是 递 推 方程 是 : 
W(n) = 2W(n—1)+1 
an =1 
第 一 种 方程 可 以 使 用 和 迭代、 递归 树 、 尝 试 等 方法 求解 . 
第 二 类 递 推 方 程 反 映 的 是 类 似 于 二 分 检索 和 二 分 归并 排序 算法 的 分 治 算法 . 在 均衡 划 
分 的 情况 下 ,a 代表 归 约 后 的 子 问题 个 数 ,b 代表 子 问题 规模 减少 的 倍数 ,d(n) 表 示 归 约 过 
程 和 综合 解 过 程 的 总 工作 量 . 这 两 类 方程 的 求解 方法 可 以 使 用 迭代 法 .递归 树 和 主 定理 等 
使 用 大 @ 记号 表示 解 ,有 如 下 几 种 常见 的 形式 : 
当 d(n) 为 常数 时 ,如 果 a 二 1, 那 么 符合 主 定理 的 第 二 种 情况 ,于 是 T(n) 二 O(logn); 如 
果 “天 1,mw" 不 是 常数 ,属于 主 定理 的 第 一 种 情况 ,T(z) 一 BCzew" ) ,于 是 得 到 ， 


(ns) 4 天 1 
O(logn) a=1 


当 dz) 一 cz 时 ,如 果 a 二 45, 对 应 主 定理 的 第 一 种 情况 ,方程 的 解 是 8(nw% ) ;如 果 a 二 
4b, 对 应 主 定理 的 第 二 种 情况 ,方程 的 解 是 9(nlogn) ;如 果 a 一 5, 对 应 主 定理 的 第 三 种 情况 ， 
方程 的 解 是 @(d(n)) 二 9(n). 于 是 有 

O(n) a=b 
T(n) = [eco a=b 
On) a>b 

利用 上 述 结果 ,直接 可 以 得 到 二 分 检索 算法 的 时 间 复 杂 度 为 9(logn) ,二 分 归并 排序 算 
法 的 时 间 复 杂 度 为 9(nlogn). 

下 面 看 一 个 芯片 测试 的 例子 . 

例 2.1 有 宛 片 芯片 ,已 知 其 中 好 芯片 比 坏 芯片 至 少 多 1 片 . 现在 需要 通过 测试 从 中 找 
出 1 片 好 芯片 . 测试 的 方法 是 : 将 2 片 芯 片 放 到 测试 台 上 ,2 片 芯片 互相 测试 并 报告 测试 结 
果 :“ 好 ”或 者 " 坏 ”, 假定 好 芯片 的 报告 是 正确 的 , 坏 芯片 的 报告 是 不 可 靠 的 (可 能 是 对 的 ,也 
可 能 是 错 的 ). 请 设计 一 个 算法 ,使 用 最 少 的 测试 次 数 来 找 出 1 片 好 芯片 . 

由 于 好 芯片 至 少 比 坏 芯片 多 1 片 .对 1 片 芯 片 来 说 ,如 果 至 少 有 lx/2j 片 芯片 都 报告 它 
是 “好 的 ”, 那 么 这 片 芯片 一 定 是 好 的 ,否则 它 就 是 坏 芯 片 . 一 个 蛮 力 算法 就 是 任 取 1 片 芯 片 ， 
然后 用 其 余 所 有 芯片 来 测试 它 . 如果 它 是 好 的 ,算法 结束 ;如 果 它 是 坏 的 ,抛弃 它 , 再 任 选 
1 片 进行 测试 ,直到 找到 1 片 好 芯片 为 止 . 这 个 算法 最 坏 情 况 下 需要 BG ) 次 测试 . 

下 面 尝 试 一 下 分 治 策略 . 初始 的 想法 就 是 : 将 nn 片 芯片 两 两 一 组 分 成 n/2 组 ,每 组 测试 
1 次 . 就 像 体育 比赛 的 淘汰 赛 一 样 , 通 过 第 一 轮 的 [zx/2 隐 测 试 淘汰 一 部 分 芯片 , 剩 下 的 芯片 
构成 一 个 规模 较 小 的 子 问题 进入 第 二 轮 . 如 果 测 试 的 芯片 不 超过 3 片 ( 即 子 问 题 规模 小 于 等 
于 3) ,并 且 好 芯片 比 坏 芯 片 至 少 多 1 片 .那么 只 要 测试 1 次 就 可 以 找 出 好 芯片 . 剩 下 需要 考 


T(n) = | 


分 沙 般 略 


虑 的 一 个 问题 是 : 采取 什么 样 的 淘汰 规则 ,能够 保证 进入 下 一 轮 的 好 芯片 比 坏 芯片 至 少 多 1 
片 , 换 名 话说 ,每 轮 测 试 丢 弃 的 坏 芯 片 数 至 少 和 丢弃 的 好 芯片 数 一 样 多 . 这 涉及 算法 的 正确 
性 . 另 一 个 问题 是 : 每 轮 测 试 淘汰 的 芯片 数 占 测 试 芯片 数 的 比例 是 多 少 . 这 涉及 子 问题 规模 
缩小 得 有 多 快 , 它 决 定 了 算法 的 效率 . 

先 分 析 一 下 不 同 的 测试 报告 究竟 给 出 了 什么 信息 . 假设 放 到 测试 台 上 的 芯片 是 A 和 
已 , 表 2.1 列 出 了 可 能 的 结果 . 


表 2.1 测试 结果 
A 报告 也 报告 结 论 
1 B 是 好 的 和 A 是 好 的 A,B 都 好 或 A,B 都 坏 
2 B 是 好 的 A 是 坏 的 至 少 1 片 是 坏 的 
EE B 是 坏 的 A 是 好 的 至 少 1 片 是 坏 的 
4 B 是 坏 的 A 是 坏 的 至 少 1 片 是 坏 的 


如 果 测 试 结果 是 情况 1, 那么 A、B 中 留 1 片 ,丢掉 1 片 ;如 果 是 后 三 种 情况 , 则 把 A 和 B 全 
部 丢掉 . 

命题 2.1 当 n 是 偶数 时 ,在 上 述 规 则 下 ,经 过 一 轮 淘汰 , 剩 下 的 好 芯片 比 坏 芯 片 至 少 
多 1 片 ， 

证 设 A.B 都 是 好 芯片 的 有 i 组 ,A、B 一 好 一 坏 有 j 组 ,A、B 都 坏 的 有 k 组 ,那么 

2 十 21 十 2 一 2 县 2 十 >>24 十 1) 一 1 二 人 
经 过 淘汰 后 , 剩 下 好 芯片 数 为 i, 坏 芯 片 数 至 多 为 k, 满 足 ;一 人 . 

但 是 当 是 奇数 , 没 被 分 组 而 轮空 的 是 1 片 坏 芯 片 时 ,可 能 淘汰 后 剩 下 的 好 芯片 数 与 坏 
芯片 数 相等 . 比如 z 一 7, 有 4 片 好 芯片 ,3 片 坏 芯 片 . 如 果 分 组 为 : {好 ,好 )., {好 ,好 },{ 坏 ， 
坏 } ,1 片 坏 芯 片 轮空 ,那么 淘汰 后 的 4 片 芯 片 有 可 能 恰好 2 好 2 坏 ， 对 于 奇数 的 情况 ,可 以 
增加 一 轮 特殊 处 理 , 即 把 这 个 轮空 的 芯片 与 每 1 片 其 他 芯片 都 测 一 遍 . 根据 前 面 的 分 析 , 通 
过 这 些 测 试 可 以 判断 这 片 芯片 的 好 坏 . 如 果 它 是 好 的 .算法 结束 ;如 果 它 是 坏 的 ,丢弃 它 . 这 
些 额 外 工作 需要 O(n) 次 测试 ,而 这 轮 分 组 内 的 测试 也 需要 O(n) 次 (精确 说 应 该 是 ln/2 欣 )， 
因此 不 论 是 偶数 还 是 奇数 , 归 约 为 子 问题 的 工作 量 都 是 O(n). 

下 面 考 虑 第 二 个 问题 ,因为 每 组 至 少 需要 丢掉 1 片 芯 片 , 因 此 经 过 一 轮 测 试 后 , 剩 下 的 
芯片 数 至 多 为 n/2. 算法 的 伪 码 描述 如 下 : 

算法 2.3 Test(n) 

输入 ; n 片 芯片 构成 的 数组 ,其 中 好 芯片 至 少 比 坏 芯 片 多 1 片 


输出 : 1 片 好 芯片 

1 

2. while k>3 do 

3: 将 芯片 分 成 lk/2 有 组 // 如 有 轮空 芯片 ,单独 测试 .根据 情况 丢弃 或 保留 
4. for i=1 to [LA/2 do 


让 2 片 好 , 则 任 取 1 片 留 下 
else 2 片 同时 丢掉 
到 A< 剩 下 的 芯片 数 
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6. 证 k=3 
then 任 取 2 片 芯片 测试 
让 1 好 1 坏 , 取 没 测 的 芯片 
else 任 取 1 片 被 测 芯 片 
7. ff 二 2 or 1 then 任 取 1 片 


考虑 该 算法 的 最 坏 情 况 下 的 时 间 复 杂 度 ,有 如 下 递 推 方 程 : 
人 一 w( 全 上 oo ns 


W(n)=1 第 起 = 名 

根据 前 面 关 于 递 推 方程 的 分 析 结 果 , 可 以 得 到 W(n) 二 O(n). 不 难看 出 , 比 起 蛮 力 算法 ， 
分 治 算法 在 效率 上 有 明显 的 提高 . 

例 2.2 设 a 是 一 个 给 定 实数 ,计算 a”, 其 中 妈 为 自然 数 . 

如 果 选 择 基本 运算 是 数 的 乘法 ,那么 蛮 力 算法 将 对 a 进行 2 一 1 次 相 乘 ,算法 的 时 间 复 
杂 度 是 O(n). 

下 面 考虑 分 治 算法 .将 a" 看 作 两 部 分 寡 的 乘积 ,每 部 分 都 是 一 个 子 问题 , 即 a 每 . 更 
确切 地 说 ,有 


太 7 为 偶数 
a” 3 ed x i xa nn 为 奇数 
请 读者 给 出 该 算法 的 伪 码 描述 .关于 该 算法 的 最 坏 情况 下 的 时 间 复 杂 度 W(n) 有 : 
W(n) = W(n/2)+O() 
W(1)=0 
于 是 得 到 W(n) 二 O(logn). 
需要 说 明 的 是 ,如 果 更 精细 地 考虑 数 的 乘法 ,常常 把 基本 运算 选 作 位 乘 , 即 每 1 位 乘 
1 次 就 看 作 是 执行 了 1 次 基本 运算 . 这 里 只 是 比较 粗糙 的 估计 . 这 个 算法 可 以 用 于 Fibonacci 
数 的 计算 中 . 
定义 2.1 Fibonacci 数 FF,(n 三 1) 构 成 下 述 数 列 ; 
ll, 1, 2, 3, 5» 8, 13, 
其 中 每 一 项 等 于 它 前 面相 邻 两 项 的 和 . 
为 了 设计 算法 的 方便 ,在 这 个 数列 前 面 加 上 一 项 Fo 王 0, 如 果 用 递归 的 方式 定义 ,可 以 


0 ifn=0 
F, = | 话 交 三 
Fees Fs 让 元 并 
我 们 的 问题 是 : 对 于 给 定 的 ,计算 己 ,. 
通常 的 算法 是 从 Fu ,Fi ,…: 根 据 定义 陆续 相 加 ,最 后 得 到 已 , .需要 做 9(z) 次 加 法 .下面 
考虑 分 治 算法 . 这 个 算法 的 时 间 复 杂 度 可 以 达到 O(logn). 首先 给 出 下 面 的 定理 . 
定理 2.1 设 {F,) 为 Fibonacci 数 构成 的 数列 ,那么 


jy F, Fb -| 
Bg -区 


写作 


证 ”对 进行 归纳 . 


F, FF 
和 时 ,左边 是 | 


业 全 
是 ,显然 左边 与 本 
加 右边 是 | ， a 显然 左边 与 右边 相等 


Fari LT TP 
设 双 命题 》 ,有 = , 那 乏 
假设 对 于 命题 为 真 | | |， 那么 


bm i- |- Ss 六 拓 "| 
2 3 0 | 而 


i | i E> LL 
= ls 中 -| 时 | 
由 归纳 法 可 知 命题 对 一 切 正 整 数 1 成 立 . 
这 个 定理 告诉 我 们 ; 要 计算 .可 以 通过 笨 阵 | 败 n 一 1 次 雷 运 算得 到 . 从 而 可 以 
使 用 高 效 的 关于 短 运 算 的 分 治 算法 . 矩阵 乘法 的 基本 运算 是 元 素 相 乘 , 两 个 二 阶 矩 阵 相 乘 需 
要 做 8 次 元 素 相 乘 . 8 是 一 个 常数 ,根据 上 面 关于 ur 的 分 治 算法 ,这 种 乘法 的 时 间 复杂 度 是 
O(logn). 


2.3 改进 分 治 算法 的 途径 


前 面 已 经 给 出 了 一 些 例子 .分 治 算法 比 起 通常 的 蛮 力 算法 在 效率 上 确实 有 了 明显 的 改 
进 . 但 分 治 策略 也 不 是 处 处 有 效 的 . 对 有 些 问 题 ,简单 的 分 治 算法 对 提高 求解 效率 没 用 ,原因 
主要 是 在 于 分 治 算法 的 递归 调用 . 

首先 是 产生 的 子 问题 个 数 较 多 . 考虑 上 面 关于 时 间 复 杂 度 的 函数 . 在 许多 情况 下 采用 二 
分 法 ,通常 0 一 2, 只 要 一 次 调用 产生 3 个 以 上 的 子 问 题 ,往往 有 T(z) 一 OOCzeg" ). 在 这 个 解 
中 ,a 代表 子 问 题 个 数 ,a 越 大 ,函数 的 阶 就 越 高 ,从 而 时 间 复 杂 度 就 越 高 ,因此 减少 子 问题 
个 数 是 降低 时 间 复 杂 度 的 有 效 途径 . 怎样 减少 子 问题 个 数 ? 一 种 可 行 的 办 法 是 寻找 子 问题 
之 间 的 依赖 关系 ,如 果 一 个 子 问题 的 解 可 以 用 其 他 子 问题 的 解 通过 简单 的 运算 得 到 ,那么 在 
用 到 这 个 子 问 题 的 解 时 ,不 必 重 新 递归 计算 ,而 是 通过 组 合 其 他 子 问 题 的 解 来 得 到 . 这 样 就 
可 以 有 效 减少 子 问题 的 个 数 ,从 而 提高 算法 效率 . 

其 次 , 递归 过 程 内 的 工作 量 过 多 也 是 影响 算法 效率 的 一 个 重要 因素 . 如 果 在 算法 设计 
时 ,尽量 把 某 些 工 作 提 到 递归 过 程 之 外 ,作为 预 处 理 . 从 而 有 效 减少 递归 内 部 的 调用 工作 量 ， 
也 是 提高 算法 效率 的 一 个 有 效 途 径 . 

下 面 通过 几 个 例子 说 明 这 些 设计 思想 . 


2.3.1 通过 代数 变换 减少 子 问题 个 数 


考虑 下 面 的 整数 乘法 问题 . 

例 2.3 设 XX,Y 是 两 个 n 位 二 进 制 数 .n 二 2*, 求 XY. 

以 每 位 乘 1 次 作为 1 次 基本 运算 ,按照 通常 的 乘法 ,X 的 每 一 位 都 要 和 YY 的 n 个 位 相 
乘 ,需要 乘 次 .由 于 X 有 7 位 ,总 共 需 要 nw? 次 位 乘 , 因 此 普通 乘法 的 时 间 复 杂 度 是 O(n ). 

下 面 考虑 分 治 算法 .将 X 和 Y 都 分 成 相等 的 两 段 , 每 段 zw/2 位 .X 的 上 半 段 (高 位 部 分 ) 
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记 作 A, 下 半 段 (低位 部 分 ) 记 作 B; 类 似 地 ,Y 的 上 半 段 和 下 半 段 分 别 记 作 C 和 ,那么 有 

和 一 A2”: 十 如 

G2 十 殉 

XY = AC 2" + (AD + BC)2"”? + BD 
根据 这 个 公式 ,为 了 计算 XY, 可 以 分 别 计算 AC,AD,BC 和 BD ,然后 把 AC 乘 以 2" ,相当 了 
向 高 位 移 n 位 的 操作 ,AD 十 BC 乘 以 2”, 即 向 高 位 移 nw/2 位 ,然后 把 这 两 个 结果 与 BD 相 
加 .计算 AC、AD、BC 和 BD ,其 中 每 个 乘法 都 是 两 个 /2 位 的 整数 相 乘 ,相当 于 规模 为 n/2 
的 4 个 子 问题 ;附加 的 移 位 和 相 加 的 操作 是 从 子 问题 的 解 综 合 得 到 原 问 题 的 解 的 额外 工作 ， 
这 部 分 工作 随 nn 增加 成 线性 增长 ,可 以 记 为 cn, 其 中 c 是 某 个 常数 . 于 是 得 到 时 间 复 杂 度 的 
递 推 方程 如 下 : 


nl 


We 一 4w (时)]+ a 


W(1)=1 
根据 前 面 的 结果 得 : W(n) 二 O(n ) 二 O(n ). 

这 个 分 治 算法 与 常规 乘法 的 时 间 复 杂 度 一 样 . 做 了 这 么 多 工作 ,算法 居然 没有 丝毫 的 改 
善 . 观察 时 间 复 杂 度 函数 的 表示 ,ze 中 的 4 代表 子 问 题 个 数 ,如 果 能 把 子 问题 减少 为 3 个， 
那么 算法 的 时 间 复 杂 度 就 会 降低 到 O(n 号 ) ,大 约 是 O(n*”) ,这 就 比 O(n?) 有 明显 的 改进 , 

根据 代数 知识 ,不 难 找到 这 些 子 问题 之 间 的 依赖 关系 

AD 二 BC=(4A 一 B)(CD 一 C) 十 AC 十 BD 

假设 AC 和 BD 已 经 得 到 . 由 这 个 公式 可 以 看 出 .为 得 到 AD 十 BC, 并 不 需要 计算 AD 和 BC 
两 个 子 问题 .实际 上 只 需要 计算 一 个 新 的 子 问 题 , 即 (A 一 B)(D 一 C), 而 AC 与 BD 可 以 直 
接 调用 原来 的 结果 , 额外 的 加 法 和 减法 都 只 增加 O(n) 的 时 间 , 于 是 把 子 问 题 减少 到 3 个 ， 
额外 的 工作 仍旧 是 O(z). 只 不 过 cn 中 的 常数 c 大 了 一 点 就 是 了 . 于 是 有 递 推 方程 : 


全 3W[ 全 上 


We = 1 
解 得 
W(n) = O(n®"®) = O(n ) 

这 个 例子 说 明 , 有 时 候 简 单 使 用 分 治 策略 不 一 定 能 得 到 预期 的 效果 ,在 设计 中 需要 认真 
考虑 如 何 减少 子 问题 个 数 才 能 得 到 好 的 分 治 算法 . 下面 的 例子 是 关于 矩阵 乘法 的 著名 的 
Strassen 算法 . 

例 2.4 设 A,B 是 两 个 ” 阶 和 矩阵,z 一 关 ,， 计算 C=AB. 

以 元 素 的 1 次 乘法 作为 1 次 基本 运算 ,考虑 通常 的 矩阵 乘法 算法 .A、B 都 是 ， 阶 矩阵 ， 
它们 的 积 C==AB 也 是 n 阶 矩 阵 . 因为 C 中 含有 n? 个 元 素 ,每 个 元 素 cjy (1<i,j 三 nn) 的 计算 
公式 是 : 


c = aaby azbz tT ambn; 
其 中 ,aa ,awz，…,am 是 A 的 第 i 行 元 素 ,bi, bs;，…,bw 是 B 的 第 j 列 元 素 . 于 是 每 个 cj 需要 
n 次 乘法 ,为 得 到 C 的 n? 个 元 素 : 总 计 需 要 nm? 次 乘法 . 于 是 算法 的 时 间 复 杂 度 是 W(n) 王 
(O17 


下 面 考虑 分 治 算法 . 将 A.B、C 每 个 矩阵 划分 成 4 块 相等 的 小 矩阵 ,得 到 
Ai Ai 了 了 > Cu Cz 
0 
Aa A 了 2 也 2 Ca C2s 


An Aw]IfBn Bi Cu Cz 
Pm mm mu 上 网 el 
根据 矩阵 运算 的 性 质 可 以 知道 ， 
Cn = AunBun++AwBa, C1 一 AlBs 十 AizB2 
Ca = AaBu+t+AzzBa, C2 = AzBi1s + A Bo; 
这 说 明 为 得 到 C 需要 分 别 计算 8 个 子 问题 : A Bt Ai Ba 、 An Bi Ai Ba As Bi 、 
As Ba 、Azi Bis、Azs Bos ,每 个 子 问题 都 是 n/2 阶 的 两 个 矩阵 相 乘 . 此 外 在 综合 解 的 过 程 中 需 
要 和 矩阵 加 法 ,每 两 个 矩阵 相 加 需要 做 ww 个 元 素 相 加 , 即 OG ) 的 额外 工作 量 . 于 是 有 递 推 
方程 


由于 


ha 一 sw (于 ]+ on 
W(1)=1 
该 方程 的 解 是 Wn) 二 Om) 二 Om). 这 个 分 治 算法 与 普通 乘法 的 时 间 复 杂 度 一 样 . 

能 不 能 通过 子 问 题 之 间 的 依赖 关系 设法 减少 计算 子 问题 的 个 数 呢 ?Strassen 算法 通过 
代数 变换 把 子 问题 减少 到 7 个 . 具体 的 方法 是 : 设 定 M1,… ,Mi 等 中 间 结 果 和 矩阵 ,每 个 矩阵 
的 计算 对 应 一 个 n/2 规模 的 子 问题 , 即 

Mi = Aun(Bis — Bzs) 


Ms = (Au 十 Alz)B2 


Ms = (Az + Azs ) B11 
AM = A (Ba — Bn) 
Ms = (An + Azs) (Bu + Bzs) 


Ms 一 (As — Azs ) (Bz + Bz ) 
M; = (An — Aa) (B+ Bs) 
然后 把 Cu .Ca .Cn 、Czs 用 这 些 中 间 结 果 和 矩阵 的 加 法 和 减法 表示 出 来 , 即 
Cu = Ms 十 M 一 Ms 十 Me 
Cu 一 Mi 十 Me 
Ca = Mas 十 M4 
Cz = Ms 十 Mi 一 Ms 一 M， 
上 述 和 矩阵 加 法 和 减法 共 18 次 ,每 次 矩阵 加 法 或 减法 的 额外 工作 量 都 是 (z/2) 次 元 素 
的 加 法 或 减法 . 一 般 来 说 ,元 素 的 加 减法 比 元 素 乘法 运行 得 更 快 , 因 此 总 的 额外 工作 量 不 超 
过 18(z/2) ,于 是 得 到 下 面 的 递 推 方程 


2 
a n n 
W(n) = 7 人 ( 营 上 + 18( 瑟 ) 


W(1)=1 


芋 
出 
出 


定理 得 


圳 N 器 
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W(n) = On’) = O(n ) 
这 个 分 治 算法 比 起 普通 乘法 在 效率 上 有 明显 的 改进 . 


2.3.2 利用 预 处 理 减 少 遂 归 内 部 的 计算 量 


先 看 一 个 求 平面 上 最 邻近 点 对 的 例子 . 这 是 一 个 计算 几何 中 的 问题 ,其 背景 可 能 来 自习 
机 场 的 航空 调度 问题 . 设 空 间 有 nn 架 飞 机 ,为 了 安全 调度 ,需要 了 解 其 中 距离 最 近 的 两 架 飞 
机 是 什么 飞机 ,它们 的 距离 是 多 少 . 为 了 简单 起 见 .我 们 考虑 一 个 平面 上 的 简单 模型 . 

例 2.5 设 平面 上 有 7n 个 点 Pi ,Ps,…,P,,n 之 1,P; 的 直角 坐标 是 (xi,yi) ,i 二 1,2,…， 
n. 求 距离 最 近 的 两 个 点 及 它们 之 间 的 距离 . 这 里 的 距离 指 的 是 通常 的 距离 , 即 点 P; 和 也; 的 
距离 是 


n 


d(Pi,P)) = Va zx) Fy y,) 
齐 力 算法 需要 计算 每 对 点 之 间 的 距离 ,从 中 比较 出 最 小 距离 .有 n(n 一 1)/2 个 点 对 , 假 


1 设 每 对 点 的 距离 计算 需要 常数 时 间 , 那 么 , 蛮 力 算法 将 需要 
. Ox) 的 时 间 . 
。 = | ” 下 面 考虑 分 治 算法 . 初步 的 想法 是 : 如 图 2. 1 所 示 , 用 
。 一 条 垂直 线 ! 将 整个 平面 点 集 P 划分 成 左 半 平 面 Pi 和 右 
. 。 半 平 面 PR 两 部 分 ,使 得 P 和 PR 的 点 数 近似 相等 , 即 


[B= 于 | 1m l=| 寺 | 


图 2.1 将 平面 划分 成 左 、 右 两 半 加 
这 里 | P| 、|Pi|、| PR| 分 别 表 示 各 个 点 集 所 含 的 点 数 . 

P 中 的 最 邻近 点 对 可 能 有 三 种 情况 : 两 个 点 都 在 Pi 中 ;两 个 点 都 在 Pr 中 ;或 者 一 个 点 在 
Pi 中 , 另 一 个 点 在 Pr 中 .算法 分 别 考虑 这 三 种 情况 . 对 于 前 两 种 情况 ,可 以 分 别 计算 P 和 
PR 中 的 最 邻近 点 对 , 这 是 两 个 z/2 规模 的 子 问 题 . 对 于 第 三 种 情况 ,算法 需要 找到 由 一 个 
Pi 中 的 点 和 一 个 PR 中 的 点 所 构成 的 最 邻近 点 对 . 假设 P 和 Pr 中 的 最 邻近 点 对 的 距离 分 
别 是 2 和 6k, 令 6 二 min{6L ,6g) ,那么 无 论 在 Pi 中 的 任 两 点 ,还 是 在 Pr 中 的 任 两 点 之 间 的 
距离 都 不 小 于 6. 这 就 是 说 ,如 果 出 现 了 第 三 种 情况 , 即 由 Pi 和 与 Pr 中 各 取 一 个 点 构成 了 
P 中 的 最 邻近 点 对 ,那么 这 一 对 点 的 距离 应 该 不 超过 6. 于 是 ,为 找到 这 样 的 两 个 点 ,只 需要 
检查 在 直线 ! 两 边 距 1 不 超过 6 的 窗 缝 内 的 点 即 可 . 

根据 这 个 设计 思想 ,可 以 给 出 算法 的 伪 码 描述 如 下 : 

算法 2.4 MinDistance(P,X,Y) 


输入 : nn 个 点 的 集合 P, XX 和 YY 分 别 给 出 P 中 点 的 横 、 纵 坐标 
输出 : 最 近 的 两 个 点 及 距离 


1. 如 果 忆 中 点 数 小 于 等 于 3, 则 直接 计算 其 中 的 最 小 距离 

2. 排序 X, 了 

3. 做 垂直 线 /将 P 近似 划分 为 大 小 相等 的 点 集 Pr 和 PR :已 的 点 在 ! 左边 ,PR 的 点 在 /! 右边 

4. MinDistance( PL ,XL ,YL); di 二 Pi 中 的 最 小 距离 // 递 归 计 算 左 半 平 面 最 邻近 点 对 

5， MinDistance(PR ,XR ,Yr); DR 一 PR 中 的 最 小 距离 // 递 归 计 算 右 半 平 面 最 邻近 点 对 

6. 6<—min(6, ,0k) 

7. 对 于 在 线 ! 左边 距离 6 范围 内 的 每 个 点 ,检查 / 右边 是 否 有 点 与 它 的 距离 小 于 6, 如 果 存 在 则 将 


6 修改 为 新 值 


分 治 黄 略 


从 算法 MinDistance 的 伪 码 描述 可 以 看 出 , 行 4 和 行 5 是 递归 调用 ,每 个 对 应 于 n/2 规 
模 的 子 问题 , 行 2 的 排序 需要 O(nlogn) 时 间 , 行 3 的 划分 不 需要 额外 的 工作 量 , 行 6 需要 的 
时 间 是 常数 .我 们 只 要 估计 出 行 7 的 计算 所 需要 的 时 间 , 就 可 以 1 
列 出 该 算法 时 间 复 杂 度 的 递 推 方程 . d 

下 面 分 析 一 下 行 7 的 运算 . 如 图 2.2 所 示 , 设 P; 是 在 线 / 忆 
左边 的 任 一 点 ,坐标 为 (zi'yi). 在 右边 罕 缝 内 距 P; 小 于 6 的 点 
其 纵 坐标 一 定 在 yi; 十 6 与 y: 一 9 之 间 . 换 句 话说 ,这 些 点 只 能 位 


2 


于 右边 高 度 不 超过 26、 宽 度 不 超过 6 的 矩形 区 域内 . 在 这 个 范围 
内 可 能 有 多 少 个 点 呢 ?” 如 图 2. 2 所 示 , 将 这 个 矩形 分 成 6 个 相 
等 的 小 矩形 ,每 个 小 矩形 的 宽 是 8/2 ,高 是 28/3. 根据 勾 股 定理 ， po 
小 矩形 的 对 角 线 的 长 度 d 是 Np 
-+ 应 
a=d(2)] + = 人 + 入 = 晤 
这 说 明 在 任何 小 矩形 内 至 多 只 能 有 1 个 点 . 因此 ,右边 与 P, 的 距离 小 于 6 的 点 数 至 多 可 能 


有 6 个 . 对 每 个 点 来 说 ,检查 另 一 边 是 和 否 有 点 与 它 的 距离 小 于 6, 只 需要 考查 常数 个 点 . 假设 
所 有 距 线 ! 不 超过 6 的 窗 缝 中 的 点 构成 集合 S. 只 要 S 中 点 的 纵 坐 标 已 经 排 好 序 ( 通 过 顺序 
扫描 了 ,检查 每 个 点 的 横 坐 标 , 看 看 它 是 否 距 ! 小 于 9. 如 果 是 ,就 把 它 放 到 S 中 . 这 需要 额外 
的 Om) 时 间 , 不 超过 行 2 的 O(nlogn) 排 序 时 间 ) ,我 们 可 以 按照 S 中 点 的 纵 坐 标 顺 序 考 查 ， 


过 6 个 ,因此 这 个 检查 至 多 需要 考查 12 个 纵 坐 标 ( 如 果 高 度 是 $, 准 确 地 说 是 不 超过 
8 个 ) ,这 仅 需要 常数 时 间 . 由 于 S 的 点 数 不 超过 ”因而 对 窗 缝 中 所 有 点 的 检查 需要 
O(CoD 时 间 . 而 这 个 时 间 也 不 超过 行 2 的 排序 时 间 . 于 是 ,除了 递归 调用 外 ,额外 的 工作 时 
间 是 O(nlogn). 

基于 上 面 的 分 析 , 不 难 写 出 该 算法 时 间 复 杂 度 的 递 推 方程 


和 一 27 (名 + Omlogm) 


T(n) = O(1) n3 
考查 这 个 方程 ,4 二 2,6 二 2,nm% 一 n, 尽管 函数 nlogn 的 阶 比 n 高 ,但 是 找 不 到 e 二 0, 使 得 
nlogn = Qn'™) 


因此 该 方程 不 能 使 用 主 定理 求解 .只 能 使 用 递归 树 的 方法 ,求解 过 程 请 见 第 1 章 的 例 1. 19. 
于 是 分 治 算法 MinDistance 的 时 间 复 杂 度 是 T(n) 二 O(nlog*n), 比 起 蛮 力 算法 的 O(n?) 已 经 
有 了 明显 的 改进 . 

这 个 算法 还 能 不 能 改进 得 更 好 一 些 ? 考查 上 述 关 于 时 间 复 杂 度 函数 的 递 推 方 程 ,不 难 
发 现在 每 次 递归 调用 时 主要 的 消耗 在 排序 上 , 它 需 要 O(nlogn) 时 间 . 如 果 能 够 把 排序 工作 
移 到 递归 调用 之 外 ,就 有 可 能 减少 递归 调用 的 工作 量 ,从 而 提高 算法 的 效率 .但 是 ,在 检查 左 
边 和 右边 各 一 个 点 的 距离 时 需要 当前 输入 中 的 点 是 按 坐 标 排 好 序 的 点 . 如 何 满足 这 个 需求 ? 
能 不 能 在 子 问题 递归 调用 时 .通过 对 原来 已 排序 的 数组 X 和 了 的 简单 分 拆 操作 ,得 到 每 个 


第 
2 
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子 问题 的 排序 数组 Xi ,YL ,Xr,Yr? 对 于 横 坐 标 数组 X. 和 Xk 没有 问题 ,因为 划分 的 过 程 
就 是 把 X 从 中 间 截 断 . 但 是 对 按 纵 坐标 排序 的 数组 Y, 哪 个 数 应 该 分 到 YY.?” 哪个 数 应 该 分 
到 Yr? 与 它们 在 Y 中 的 位 置 没 有 直接 关联 ,没有 任何 规律 可 循 。 回想 二 分 归并 排序 算法 ， 
其 中 有 一 个 归并 的 子 过 程 , 它 把 两 个 n/2 规模 的 排 好 序 的 数组 合并 成 一 个 规模 为 的 数组 . 
能 不 能 把 这 个 过 程 反 过 来 , 即 从 头 到 尾 扫描 Y 数组 ,如 果 这 个 点 的 横 坐 标 属于 Xi ,就 把 它 
的 纵 坐标 放 到 Yi ;如 果 这 个 点 的 横 坐 标 属于 Xx ,就 把 它 的 纵 坐 标 放 到 YE. 

例如 ,P 中 含有 4 个 点 Pi ,P,P;,Ps. 初始 输入 的 义 与 Y 数组 如 表 2. 2 所 示 . 


表 2.2 原始 输入 
| 2 3 4 
055 2 -2 1 
2 3 4 = 区 


经 过 排序 后 的 X 与 了 如 表 2. 3 所 示 . 括号 中 的 数 表示 在 初始 输入 数组 中 的 下 标 . 如 排 

在 XX 数组 第 二 位 的 0.5(1) 表示 0.5 是 Pi 的 横 坐 标 . 进入 递归 调用 以 后 ,将 X 划分 为 Xr 

和 Xk, 每 组 两 个 数 ;Y 划分 为 Y 和 Yk, 每 组 两 个 数 . 当 扫 描 Y 数组 时 ,首先 检查 一 1, 下 标 是 

4, 横 坐标 应 该 处 在 XR ,因此 一 1 应 该 放 到 Y 中 ;接着 是 2, 下 标 是 1, 横 坐标 应 该 处 在 Xi， 
因此 2 应 该 分 到 YL 中 . 照 此 处 理 , 最 后 的 结果 如 表 2. 4 所 示 . 
表 2.3 对 X 与 Y 排 序 后 的 输入 


XxX —2(3) 0.5(1) 1(4) 2(2) 


一 江村 2(1) 3(2) 4(3) 


表 2.4 划分 左右 两 半 后 两 个 子 问题 的 输入 


XL 一 263》 0.5(1) XR 1(4) 2(2) 


Ys 2(1) 4(3) YR 一 1(4) 3(2) 


选择 合适 的 数据 结构 ,在 这 轮 拆 分 处 理 中 ,Y 中 的 每 个 数 只 需要 常数 工作 量 , 因 此 拆 
分 Y 的 总 工作 量 是 O(). 综 上 所 述 , 改 进 的 途径 就 是 将 算法 分 成 两 步 ; 第 一 步 ,对 XX 与 Y 
进行 排序 的 预 处 理 , 第 二 步 ,算法 进入 递归 计算 .递归 计算 的 过 程 与 MinDistance 基本 上 
相同 ,只 是 把 行 2 对 X 和 工 的 排序 过 程 改 为 拆 分 过 程 就 是 了 (第 一 次 进入 时 不 必 拆 分 ). 
假设 算法 的 时 间 复 杂 度 函数 是 T(z) , 预 处 理 的 时 间 是 Ti(n) ,递归 计算 的 时 间 是 T;(n)， 
那么 有 


T(n) = Ti(n)++T,(n) 
Ti(n) = O(nlogn) 


Ts(n) 一 27:[ 辣 oom 


T2(n) = O(1) n3 
使 用 前 边 的 分 析 结 果 ,T,(n) 二 O(nlogn) ,于 是 得 到 
T(n) = O(nlogn) + O(nlogn) = O(nlogn) 


在 原来 分 治 算法 的 基础 上 ,这 个 算法 又 有 了 新 的 改进 ,降低 了 一 个 logn 的 因子 . 
2.4 典型 实例 


分 治 算法 有 着 很 多 典型 的 应 用 . 如 快速 排序 算法 Quicksort、 选 择 算法 Select、 多 项 式 求 
值 算法 等 . 这 些 算法 可 能 在 数据 结构 课程 中 接触 过 ,下 面 从 分 治 策略 的 角度 对 这 些 算法 的 效 
率 做 出 分 析 . 


2.4.1 快速 排序 算法 


快速 排序 算法 由 于 它 的 方便 和 高 效 在 实践 中 一 直 得 到 广泛 的 应 用 . 设 被 排序 的 数组 是 
A ,快速 排序 算法 的 基本 思想 是 用 数组 的 首 元 素 作为 标准 将 A 划分 成 前 、 后 两 部 分 , 比 首 元 
素 小 的 元 素 构成 数组 的 前 部 分 , 比 首 元 素 大 的 元 素 构成 数组 的 后 部 分 . 这 两 部 分 构成 两 个 新 
的 子 问题 ,算法 接着 分 别 对 这 两 部 分 递归 地 进行 排序 .算法 的 关键 在 于 怎样 划分 数组 A 而 
将 其 归 约 成 两 个 子 问题 . 算法 的 伪 码 描述 如 下 , 主 程序 直接 调用 Quicksort(A,1,n) 即 可 . 


算法 2.5 Quicksort(A,p,r) //2Pr 分 别 为 数组 A 的 首 元 素 和 尾 元 素 的 下 标 
输入 : 数组 ALp.. 门 ,1] 近 巡 r 过 ” 

输出 : 从 ALpj 到 A[ 门 按照 递增 顺序 排 好 序 的 数组 A 

全 

2. then g<—Partition(A, p, 7) // 划 分 数组 ,找到 首 元 素 A[pj 在 排 好 序 后 的 位 置 q 
3. ALb] 一 A[g] 

iaksoattay Dg 

Qi 二 6 dF 2 


4. 
5 


算法 Quicksort 第 2 行 的 Partition 是 划分 过 程 , 它 以 AL2.. 门 的 首 元 素 A[p] 作 为 标 
准 ,g 表示 A[pj] 应 该 处 在 的 正确 位 置 . 即 排 好 序 后 A[Lpj] 应 该 放 在 数组 下 标 为 g 的 位 置 . 

Partition 过 程 是 这 样 进行 的 : 先 从 后 向 前 扫描 数组 A ,找到 第 一 个 不 大 于 A[Lpj] 的 元 素 
A[ 门 ,然后 从 前 向 后 扫描 A 找到 第 一 个 大 于 A[pj 的 元 素 A[ 门 , 当 i<=<j 时 ,交换 A[ 门 与 
A[ 门 . 这 时 A[ 门 后面 的 元 素 都 大 于 A[p].A[ 门 前 面 的 元 素 都 小 于 或 等 于 A[pj. 接着 对 数 
组 A 从 i 到 j 之 间 的 部 分 继续 上 面 的 扫描 过 程 ,直到 i 和 j 相遇 . 当 i>j 时 ,j 就 代表 了 
ALpj 在 排 好 序 的 数组 中 的 正确 位 置 g. 此 刻 在 g 位 置 之 前 的 元 素 都 不 大 于 A[pj, 在 g 位 置 
后 面 的 元 素 都 大 于 A[p]. 

在 Partition 过 程 结束 后 ,将 数组 元 素 A[g] 与 ALpj] 交 换 , 这 样 ALp] 就 处 于 排 好 序 后 的 
正确 位 置 ,此 刻 在 它 前 面 的 元 素 都 不 大 于 A[p], 在 它 后 面 的 元 素 都 大 于 A[p]. 从 而 原 问题 
就 以 g 为 边界 划分 成 两 个 需要 分 别 排序 的 子 问 题 了 . 

给 出 划分 过 程 Partition 的 伪 码 描述 . 行 5 到 行 6 是 从 后 向 前 找 A[j] 的 过 程 , 行 
7 到 行 8 是 从 前 到 后 找 A[ 门 的 过 程 , 行 10 是 将 A[ 门 与 A[j 交 换 . 

算法 2.6 Partition(A,p,7) 

输入 : 数组 AL 

输出 : j,A 的 首 元 素 在 排 好 序 的 数组 中 的 位 置 

i, w=A[ 科 
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2. i<p 

3. jer+l1 

4. while true do 

5. Tepeat ji< 7 一 1 
6. until A[j]<x 
入 repeat i<-i+l1 
8. until A[i]>z 
9. 证 i 

10. then A[ijeA[L] 
i else return j 


为 了 说 明 这 个 划分 过 程 .图 2. 3 给 出 一 个 13 个 元 素 快 速 排 序 的 小 例子 ,里 面 描述 了 四 
次 交换 元 素 的 过 程 . 初始 数组 A[0..12], 其 元 素 是 : 27,99,0,8,13,64,86,16,7,10,88,25， 
90. 以 27 作为 划分 标准 ,从 后 向 前 找到 第 一 个 小 于 27 的 数 是 25,j 二 11, 从 前 向 后 扫描 找到 
第 一 个 比 27 大 的 数 是 99,; 一 1,99 与 25 进行 第 一 次 交换 . 接着 继续 扫描 , 找 第 二 对 需要 交 
换 的 元 素 , 它 们 是 64 和 10. 接着 找到 第 三 对 需要 交换 的 元 素 86 和 7. 下 面 的 扫描 ,找到 /一 
7, 但 是 ;一 8, 这 时 划分 过 程 结束 . 


第 I 次 交换 | 27 | 99 | 0 | gs [ 3 [ | sse6| 7 [io[ssl25[% 
7 


第 ?次 交换 | 27 | 35 | 0 | gs [ 3 [ | sg 16| 7 [io [ss %|o% 
1 7 
第 3 次 交换 [27 [ 3 [ o [ g [13| io1s6[16[ 7 [Tssl9%lo 
i 六 
第 4 次 交换 | 27 | 33 | 0 | 8 [ 3 | o| 7 | 16 s6 [4 [ sg | % | 9% 
7 
划分 16|125|0|8|13 10| 党 27 | 86 64 | 88 | %9 | 90 
Pp 了 


图 2.3 划分 过 程 


下 面 对 这 个 算法 进行 时 间 复 杂 度 分 析 . 首先 说 明 划 分 过 程 的 工作 量 是 O(n) ,因为 每 
个 元 素 都 需要 和 首 元 素 进行 1 次 比较 (也 许 在 i 和 j 相遇 的 位 置 , 有 的 元 素 可 能 要 比较 两 
次 ). 除 了 这 个 工作 量 外 ,就 是 两 个 子 问 题 递归 调用 的 工作 量 , 因为 对 于 不 同 的 输入 ,划分 
后 的 两 个 子 问 题 规模 可 能 很 不 一 样 ,什么 是 快速 排序 算法 的 最 坏 情况 ? 先 看 几 个 特殊 的 
例子 . 

如 果 每 次 划分 得 到 的 子 问题 大 小 都 相等 , 即 每 个 子 问 题 的 规模 都 等 于 n/2, 那么 在 这 个 
实例 下 时 间 复 杂 度 函数 的 递 推 方程 是 : 


T(0) = 27( 辣 | 上 oon 


PN 
根据 主 定理 ,该 方程 的 解 是 Tn) 二 O(nlogn). 这 是 一 种 比较 好 的 情况 . 
即使 子 问 题 规模 不 一 样 . 但 是 两 个 子 问题 的 规模 遵从 一 定 的 比例 ,比如 1 : 9, 那么 时 间 
复杂 度 函 数 的 递 推 方程 是 : 


站 二 a 3)t T( 号 )+oom 


T(1)=0 
图 2.4 中 的 递归 树 给 出 了 这 个 方程 的 解 ,其 中 。 是 某 个 常数 . 这 棵 树 不 是 一 棵 均衡 的 
树 ,从 树 根 到 它 最 左边 树叶 的 路 径 最 短 . 在 这 条 路 径 上 ,每 一 层 的 并 闻 
结 点 的 值 是 父 结 点 值 的 1/10, 假 设 树 根 是 第 0 层 , 当 值 达到 1 a Vow 
和 i 10 10 

时 树叶 的 层 数 是 第 k 全 克 和 风 证 全 下 全 各 人 
( 动 j n= 1 一 A 一 logio7 100 100 100 100 ~ 

这 说 明 最 左边 的 路 径 长 度 是 logwn. 但 是 最 右边 的 路 径 , 每 层 子 。 。 册 。4 地 妥 村 


结 点 的 值 是 其 父 结 点 值 的 9/10, 根 据 和 上 面 类 似 的 分 析 , 该 路 径 
比 起 最 左边 的 路 径 要 长 得 多 .是 logiwon. 为 了 表示 时 间 的 渐 近 的 上 界 , 不 妨 取 最 长 的 路 径 作 
为 树 的 层次 . 因此 所 有 结 点 的 数值 之 和 为 
T(n) = cnlogion = O(nlogn) 

这 说 明 ,即使 子 问题 规模 不 均衡 ,但 在 比例 不 变 的 情况 下 ,快速 排序 算法 的 时 间 复 杂 度 仍旧 
是 O(nlogn). 

考虑 一 种 极端 不 均衡 的 情况 , 即 划分 后 两 个 子 问题 的 规模 一 个 是 0, 另 一 个 是 2 一 1 的 
情况 . 当 输 入 是 从 小 到 大 正 序 排列 ,或 者 是 从 大 到 小 逆序 排列 时 就 会 呈现 这 种 划分 . 这 时 关 
于 时 间 复 杂 度 的 递 推 方程 是 : 


T(z) 一 了 (2 一 1) 十 OG2) 
T() = 一 0 


根据 迭代 归纳 ,得 到 它 的 解 Tw) 二 O07), 这 对 应 了 快速 排序 算法 的 最 坏 情 况 , 即 WD) 二 O(n )， 
快速 排序 算法 在 最 坏 情况 下 的 效率 不 高 ,起 码 二 分 归并 排序 算法 在 最 坏 情况 下 可 以 达 
到 O(nlogn). 但 是 使 得 快速 排序 算法 达到 最 坏 情 况 下 的 输入 出 现 的 概率 很 低 , 它 的 平均 性 
能 还 是 不 错 的 .下面 给 出 平均 情况 下 的 时 间 复 杂 度 分 析 . 
假设 数组 A 的 首 元 素 在 排 好 序 后 处 在 个 位 置 中 的 任何 位 置 是 等 可 能 的 , 即 它 处 在 任 
何 位 置 的 概率 都 是 1/n. 如 果 它 处 在 位 置 i(i 二 1.2,…,n) ,那么 划分 后 的 两 个 子 问题 规模 分 
别 是 i 一 1 和 nn 一 i. 考虑 到 T(0) 二 0, 因 此 可 以 得 到 


T(n) = 二 (CT(O) 直人 Tw 一 和] 下 [TO 人 TG 一 2 如 于 太 


十 [Ta 一 D 二 To])} + Om 
nl 
二 芝 
n j=0 


| 
这 > MD FO 
T(1) =0 
当 把 O(n) 看 作 n 一 1 时 ,在 第 1 章 的 例 1. 14 给 出 了 这 个 方程 的 解 , 它 是 T(n) = 
Onlogn). 在 8.5.3 节 将 进一步 证 明 , 对 于 排序 问题 ,平均 情况 下 效率 最 高 的 算法 就 是 时 间 复 


杂 度 为 O(nlogn) 的 算法 . 在 这 个 意义 下 ,快速 排序 算法 是 平均 情况 下 效率 最 高 的 算法 之 一 . 
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2.4.2 选择 问题 


选择 问题 经 常 出 现在 实际 应 用 中 ,最 常见 的 是 选 最 大 、 选 最 小 、 选 中 位 数 、 选 第 二 大 等 ， 
这 些 问题 可 以 给 出 统一 的 描述 . 

设 L 是 nn 个 元 素 的 集合 ,从 工 中选 出 第 k 小 的 元 素 , 其 中 1 二 kn. 这 里 的 第 k 小 元 素 
是 指 : 当 工 中 元 素 按照 从 小 到 大 排 好 序 之 后 , 排 在 第 k 个 位 置 的 元 素 . 当 k 二 1 时 , 选 出 的 就 
是 最 小 元 素 ; 当 k 二 n 时 选 出 的 就 是 最 大 元 素 ; 当 上 二 n 一 1 时 选 出 的 就 是 第 二 大 元 素 ; 当 人 一 
[n/2 时 就 是 中 位 数 . 

下 面 考虑 选择 算法 . 

首先 看 看 选 最 大 . 最 容易 想到 的 就 是 顺序 比较 算法 . 从 前 到 后 顺序 比较 n 个 元 素 , 比 较 
时 用 maz 保留 到 当前 为 止 的 最 大 元 素 . 算法 的 伪 码 描述 如 下 : 

算法 2.7 Findmax 

输入 : nn 个 数 的 数组 工 

输出 : maz,k 

1. maz<—L[1]; k<—1 


2. fori<-2 ton do 

加 if maz<=L[i] 

4. then maz<—L[i] 

5 [ 

6. return maz,k 

该 算法 以 元 素 之 间 的 比较 作为 基本 运算 , 行 2 的 for 循环 执行 2 一 1 次 ,因此 算法 的 时 
间 复 杂 度 是 W(n) 二 n 一 1. 后 面 将 进一步 证 明 , 这 个 算法 是 求解 选 最 大 问题 在 时 间 上 最 优 的 
算法 . 不 难看 出 ,对 于 选 最 小 问题 ,只 要 将 这 个 算法 稍 加 改动 就 可 以 得 到 顺序 比较 的 
Findmin 算法 ,请 读者 给 出 相关 的 伪 码 描述 . 

接着 考虑 同时 选 最 大 和 最 小 的 算法 . 利用 刚才 的 Findmax 和 Findmin 算法 可 以 得 到 选 
最 大 和 最 小 的 算法 . 设计 思想 是 : 先 选 最 大 ,然后 把 这 个 最 大 从 工 中 删除 ,接着 选 最 小 . 算法 
的 伪 码 描述 如 下 : 

算法 2.8 

输入 : 7 个 数 的 数组 二 

输出 : maz ,min 


. 证 z 一 1 then return L[1] 作 为 maz 和 min 


1 

2. else Findmax 

和 从 工 中 删除 maz 

4 Findmin // 找 最 小 算法 与 Findmax 类 似 , 只 是 比较 时 保留 较 小 的 值 即 可 

算法 2. 8 执行 的 比较 次 数 是 

凡 (Cz) 一双 一 1 十 2 一 2 一 22 一 3 

下 面 考虑 分 组 比赛 的 方法 . 该 算法 的 基本 思想 是 : 首先 将 工 中 的 元 素 两 两 一 组 ,分 成 
by2 组 ( 当 交 是 奇数 时 有 一 个 元 素 轮空 ). 每 组 中 的 两 个 数 通过 1 次 比较 确定 本 组 的 “ 较 大 ” 
和 * 较 小 ” 把 至 多 bx/2j+1( 当 ) 为 奇数 时 ,需要 把 被 轮空 的 元 素 加 进来 ) 个 小 组 * 较 大 ” 放 到 
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一 起 ,运行 Findmax 算法 找 出 其 中 的 最 大 元 素 , 它 就 是 志 中 的 最 大 元 素 . 类 似 地 ,再 把 至 多 
Ln/2JH1( 当 为 奇数 时 ,需要 把 被 轮空 的 元 素 加 进来 ) 个 小 组 “ 较 小 ” 放 到 一 起 ,运行 
Findmin 算法 找 出 其 中 的 最 小 元 素 , 它 就 是 工 中 的 最 小 元 素 . 该 算法 的 伪 码 描述 如 下 ， 

算法 2.9 FindMaxMin 

输入 : n 个 数 的 数组 工 

输出 : maz ,min 

1. 将 nn 个 元 素 两 两 一 组 分 成 ln/2 有 组 ; 

2. 每 组 比较 ,得 到 Ln/2 个 较 小 和 Ln/2 个 较 大 ; 

3. 在 [zx/21 个 (> 为 奇数 ,是 LDz/2jH1) 较 小 中 找 最 小 min; 

4. 在 [zx/21 个 (” 为 奇数 ,是 La/2j+H1) 较 大 中 找 最 大 mazx. 


下 面 看 看 算法 2.9 是 否 比 算法 2. 8 更 好 . 从 伪 码 中 看 出 , 行 2 的 比较 进行 Lz/2 欣 , 行 

3 和 行 4 的 比较 都 执行 [n/21 一 1 次 ,于 是 算法 2 执行 的 总 比较 次 数 是 ; 
三 (ma = Ln/2J+2[n/21—2=n+[n/21—2=[3n/21—2 

显然 算法 2. 9 比 算 法 2. 8 效率 更 高 . 后 面 将 进一步 证 明 算 法 2.9 是 所 有 同时 找 最 大 和 最 小 
算法 中 时 间 复 杂 度 最 低 的 算法 . 

下 面 考虑 找 第 二 大 元 素 的 算法 . 显然 两 次 调用 Findmax 算法 可 以 得 到 第 二 大 元 素 . 先 
用 Findmax 算法 找 出 最 大 元 素 , 然 后 从 工 中 删除 mxaz ,再 调用 Findmax 找 出 剩 下 元 素 的 最 
大 元 素 . 就 是 输入 L 的 第 二 大 元 素 Second. 不 难看 出 该 算法 的 时 间 复 杂 度 是 : 

W(n)=n—1+n—2= 2n—3 

下 面 尝 试 锦标 赛 算法 . 该 算法 的 基本 思想 是 : 将 工 中 的 元 素 两 两 一 组 ,分 成 ln/2 有 组 (如 
果 n 是 奇数 时 可 能 有 1 个 元 素 轮空 ). 每 组 内 进行 比较 ,将 较 小 的 元 素 淘汰 ,每 组 中 较 大 的 元 
素 和 轮空 的 元 素 (如 果 存 在 的 话 ) 进 入 下 一 轮 . 进入 下 一 轮 的 元 素 应 该 有 [z/2 个. 在 下 一 轮 
中 ,继续 进行 同样 的 分 组 淘汰 , 胜 者 再 进入 下 一 轮 , 直 到 产生 “冠军 ”, 即 最 大 元 素 为 止 . 到 此 
算法 总 计 淘 汰 了 "一 1 个 元 素 , 每 次 比较 恰好 淘汰 1 个 元 素 , 因 此 算法 已 经 做 了 ”一 1 次 比 
较 . 但 是 ,我 们 的 任务 还 没有 完成 ,怎样 找 第 二 大 元 素 Second 呢 ? 如 果 还 是 再 次 调用 找 最 大 
算法 ,那么 算法 还 需要 "一 2 次 比较 . 这 就 和 刚才 的 两 次 调用 Findmax 的 算法 在 时 间 上 一 样 
了 .我 们 的 想法 是 : 利用 第 一 阶段 竞争 冠军 时 比较 运算 的 结果 信息 ,以 减少 第 二 阶段 的 比较 
次 数 . 这 是 可 能 的 . 首先 观察 到 ,第 二 大 元 素 只 能 在 与 最 大 元 素 max 直接 比较 所 淘汰 的 元 素 
中 产生 . 如 果 一 个 元 素 被 其 他 元 素 淘汰 ,而 那个 元 素 本 身 不 是 冠军 ,那么 该 元 素 至 多 只 能 排 
在 第 三 名 之 后 . 这 样 , 我 们 在 找 第 二 大 元 素 时 只 需 关 心 那 些 被 max 淘汰 的 元 素 即 可 . 需要 考 
虑 的 是 在 第 一 阶段 中 ,被 maz 淘汰 的 元 素 有 和 多少, 又 是 哪些 元 素 . 在 max 没 产生 之 前 ,算法 
并 不 知道 谁 是 最 后 的 冠军 .我 们 必须 要 求 每 个 元 素 把 被 自己 淘汰 掉 的 元 素 全 部 记录 下 来 .为 
此 ,在 比赛 之 前 为 每 个 元 素 设 定 一 个 指针 ,指向 一 个 链表 . 如 果 该 元 素 在 比较 中 把 其 他 元 素 
淘汰 了 ,就 把 那个 元 素 记录 在 自己 的 链表 里 . 到 max 产生 的 时 候 , 我 们 只 需要 检查 mazx 的 
链表 ,在 上 面 调用 Findmax 算法 就 可 以 找到 第 二 大 元 素 了 . 算法 的 伪 码 描述 如 下 : 


算法 2. 10 FindSecond 
输入 : 7 个 数 的 数组 工 
输出 : Second 


1 Rem 


第 
2 
章 
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2. 将 个 元 素 两 两 一 组 ,分 成 lk/2 组 ; 

3. 每 组 的 两 个 数 比较 ,找到 较 大 的 数 ; 

4. 将 被 淘汰 的 较 小 的 数 在 淘汰 它 的 数 所 指向 的 链表 中 做 记录 ; 
5. 让 A 为 奇数 then A< [LA/2|H1; 

6. else ke|k/2]; 

7. if k>1 then goto 2; 

8. maz< 剩 下 的 一 个 数 ; 

9. Secorcd< -aaz 的 链表 中 的 最 大 . 

这 个 算法 的 时 间 复 杂 度 是 多 少 ? 算法 所 做 的 比较 次 数 分 成 两 部 分 ,第 一 部 分 是 找 最 大 
元 素 max 过 程 中 的 比较 次 数 ,第 二 部 分 是 在 产生 az 后 在 其 链表 中 找 最 大 所 需要 的 比较 
次 数 . 在 第 一 部 分 ,每 次 比较 正好 淘汰 1 个 元 素 ,淘汰 n 一 1 个 元 素 的 比较 次 数 就 等 于 n 一 1. 
在 第 二 部 分 ,比较 次 数 恰好 等 于 maz 链表 中 的 元 素 个 数 减 1, 只 要 估计 出 mazx 所 淘汰 掉 的 
元 素 个 数 就 可 以 得 到 这 部 分 的 工作 量 . 我 们 有 下 面 的 命题 . 

命题 2.2 maz 在 第 一 阶段 的 分 组 比较 中 总 计 进行 了 flogn 网 比较 . 

证 设 本 轮 参与 比较 的 有 1 个 元 素 , 经 过 分 组 淘汰 后 进入 下 一 轮 的 元 素数 至 多 是 [1/21 
假设 & 轮 淘汰 后 只 剩 下 一 个 元 素 maz ,利用 

Ti/2V2 = [a/2°1 
的 结果 并 对 轮 数 k 归纳 ,可 得 到 [n/2*1=1. 车 n=24 ,那么 有 k=d==logn 二 [lognl; 如 果 24 一 7 
过 2st1, 那么 ==d 十 1=[logn1 
根据 上 面 的 命题 ,该 算法 的 时 间 复 杂 度 是 : 
W(n) 一 7 一 1 十 [logz] 一 1 7 十 [logz] 一 2 
在 第 8 章 将 证 明 , 对 于 找 第 二 大 的 问题 ,算法 FindSecond 是 时 间 复 杂 度 最 低 的 算法 . 

到 此 为 止 ,我 们 只 是 讨论 了 选择 问题 的 一 些 特例 情况 . 对 于 这 些 特 殊 情 况 ,基本 上 使 用 
顺序 比较 或 者 分 组 比较 的 方法 ,没有 看 到 明确 的 分 治 算法 的 特征 . 下 面 考虑 一 般 性 的 选 第 
上 小 问题 的 算法 ,这 里 需要 用 到 分 治 策略 . 选 第 & 小 问题 可 以 描述 如 下 : 

问题 : 选 第 小 . 

输入 : 数组 S, S 的 长 度 n, 正 整 数 k, 1<k<n. 

输出 : 第 kk 小 的 数 . 

可 以 使 用 排序 算法 , 那 就 是 先 对 S 按照 从 小 到 大 的 顺序 排序 ,然后 输出 第 kk 小 的 元 素 . 
即使 选择 最 高 效 的 排序 算法 ,该 算法 的 时 间 复 杂 度 也 是 O(nlogn). 

下 面 考虑 时 间 性 能 更 好 的 分 治 算法 ,就 是 O(n) 时间 的 算法 .为 了 叙述 的 方便 ,不 妨 假设 
S 中 的 元 素 彼此 不 等 . 我们 的 主要 思想 是 : 以 S 中 的 某 个 元 素 m* 作为 标准 将 S 划分 成 两 个 
子 数组 S 和 S; ,其 中 S, 中 的 元 素 比 m* 小 ,Ss 中 的 元 素 比 mm* 大 . 设 Si 中 的 元 素数 是 |Si | ,如 
果 k|Si|, 那 么 原 问题 就 归 约 为 在 S, 中 找 第 k 小 的 子 问 题 .如 果 k 二 15i | 十 1, 那 么 mm* 就 
是 所 要 找 的 第 k 小 元 素 . 如 果 k 二 |Si | 十 1, 那么 原 问 题 就 归 约 为 在 S; 中 找 第 小 的 子 问 
题 ,其 中 ==k 一 |S1| 一 1. 算 法 的 关键 是 如 何 确定 这 个 划分 S 的 标准 元 素 m* . 它 需要 具有 
下 述 特征 : 

(1) 寻找 m* 的 时 间 代 价 不 能 太 高 ,如果 时 间 已 经 达到 O(nlogn), 那 就 不 如 直接 使 用 排 
序 算法 了 . 因此 ,如 果 直 接 寻 找 m* ,时 间 应 该 是 O(n). 设 选择 算法 的 时 间 复 杂 度 为 T(n) , 递 


归 调 用 这 个 算法 在 S 的 一 个 真子 集 M 上 和 寻找 mm” ,应 该 使 用 T(cn) 时 间 , 这 里 的 c 是 一 个 小 
于 1 的 常数 , 它 反映 了 M 的 规模 与 S 相 比 缩小 了 多 少 . 
(2) 通过 m* 划分 的 两 个 子 问题 的 大 小 分 别 记 作 |Si | 和 |S; | ,考虑 算法 在 最 坏 情况 下 的 
性 能 ,不 妨 假设 每 次 递归 调用 时 算法 都 进入 规模 较 大 的 一 个 , 即 子 问题 规模 为 max{|Si|， 
1S;1}. 每 次 递归 调用 时 , 子 问 题 规模 与 原 问题 规模 的 比 都 不 超过 一 个 常数 d ,那么 d 二 1， 
调用 时 间 为 TC(dn). 特别 地 ,在 采用 递归 算法 寻找 m* 时 ,还 应 该 保证 c 十 d 三 1. 否则 方程 
T(n) = T(cen)+T(dn)+O(n) 


的 解 不 会 达到 O(n). 

下 面 的 分 治 算法 是 采用 递归 调用 的 方法 来 寻找 m* 的 . 先 将 S 分 组 ,5 个 元 素 一 组 , 共 分 
成 [5 | 个 组 . 在 每 组 中 寻找 一 个 本 组 的 中 位 数 , 然 后 把 这 [n/5 | 个 中 位 数 放 到 集合 M 中 . 最 
后 在 M 中 调用 选择 算法 选 出 一 个 M 的 中 位 数 , 它 就 是 我 们 要 找 的 m* . 这 次 递归 调用 的 子 
问题 规模 是 原 问 题 规模 的 1/5 ,这 个 参数 1/5 就 是 上 面 特征 (1) 中 提 到 的 常数 c. 算法 的 伪 码 
描述 如 下 : 


算法 2.11 Select(S,k) 

输入 : 7 个 数 的 数组 S, 正 整数 人 
输出 : S 中 的 第 A 小 元 素 

1. 将 S 划 分 成 5 个 一 组 , 共 [z/5| 个 组 

2. 每 组 找 一 个 中 位 数 , 把 这 些 中 位 数 放 到 集合 M 中 

3. m’" <-Select(M,T|IM|/2D // 选 M 的 中 位 数 m" ,将 S 中 的 数 划分 成 A,B,C,D 四 个 集合 
4. 把 A 和 DD 中 的 每 个 元 素 与 m" 比较 ,小 的 构成 S1 ,大 的 构成 S: ; 

5. SIS1UC; SS UB; 
6, 
7 
8 
9 


.i 计 k=|S1| 十 1 then 输出 mm* 
. else if k<I|S| 

then Select(S,, k&) 

else Select(S,, &k—|S|—1) 


算法 Select 的 行 3 中 的 A,B.C,D 是 4 个 互 不 相交 的 集合 . 图 2.5 给 出 了 相关 的 说 明 . 
为 了 简单 起 见 ,假设 S 中 的 元 素数 是 5 的 倍数 ,因此 图 中 的 5 元 素 组 恰好 有 n/5 个 . 每 列 
5 个 点 ,代表 5 个 元 素 , 恰 好 构成 一 个 组 . 每 组 的 元 素 从 上 到 下 按照 从 大 到 小 的 次 序 排列 , 那 
么 第 3 行 的 元 素 恰好 是 M 中 的 全 体 元 素 , 它 的 中 位 数 就 是 m* (图 中 最 中 心 的 点 ). 假设 在 第 
3 行 中 , 比 m* 小 的 元 素 都 分 布 在 m* 的 左边 (但 是 它们 之 间 不 一 定 按照 大 小 次 序 排列 ) , 比 
m* 大 的 元 素 都 分 布 在 m* 的 右边 (同样 地 ,它们 之 间 也 不 一 定 按照 大 小 次 序 排 列 ). 不 难看 
出 ,左下 方 的 集合 C 中 的 元 素 全 部 小 于 m* ,而 右上 方 的 集合 B 中 的 元 素 全 部 大 于 m* .但 


图 2.5 找 m* 
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是 ,对 于 A 与 D 中 的 元 素 .我 们 不 能 确定 它们 是 否 大 于 或 小 于 m* .于 是 在 算法 的 行 4 把 这 
两 个 集合 的 元 素 都 和 m* 加 以 比较 ,然后 将 小 于 m* 的 元 素 放 到 S, 中 ,大 于 m* 的 元 素 放 到 
Ss 中 . 之 后 算法 在 行 5 再 将 C 和 B 中 的 元 素 分 别 归 入 S, 和 S:. 划分 过 程 就 彻底 完成 了 . 

这 样 找 的 是 否 能 够 满足 前 面 提 到 的 划分 元 素 所 需要 的 两 个 特征 ? 下 面 通过 算法 时 
间 复 杂 度 的 分 析 给 出 回答 . 为 了 使 得 分 析 更 简单 易 懂 ,我们 忽略 一 些 细节 . 如 图 2. 5 所 示 ,不 
妨 假设 是 5 的 倍数 , 且 n/5 是 奇数 , 即 zw/5 一 2r 十 1. 于 是 得 到 : 

1A|=|1DI=2r, |1B8B|=|C|=3r+2, n= 10r+i+5 

如 果 A 和 的 元 素 都 小 于 m* ,那么 它们 的 元 素 都 加 入 到 S, 中 , 且 下 一 步 算法 又 在 这 
个 大 的 子 问题 上 进行 递归 调用 ,这 对 应 了 归 约 后 子 问 题 规模 的 上 界 . 正好 是 算法 时 间 复 杂 度 
分 析 的 最 坏 情 况 . 类 似 地 ,如 果 A 和 的 元 素 都 大 于 m* ,也 会 出 现 类 似 的 情况 . 以 前 者 为 
例 . 这 时 子 问题 的 大 小 是 : 


1AI+IDI+IC|= 7r+2 


TAR 7n Ee 7n 

16 +2 10 L: Se 10 
上 式 表明 子 问题 规模 不 超过 原 问 题 规模 的 7/10. 这 个 参数 7/10 就 是 前 面 的 特征 (2) 提 到 的 
常数 d. 根据 这 个 关系 不 难 列 出 最 坏 情况 下 时 间 复 杂 度 的 递 推 式 : 


从 上 tn 


方程 右边 的 第 一 项 是 算法 Select 在 行 3 递归 调用 找 mx* 的 时 间 , 这 时 子 问题 的 规模 是 nn/5， 
第 二 项 是 行 8 或 行 9 递归 求解 子 问题 的 代价 ,而 子 问题 的 规模 最 大 不 超过 7n/10, 剩 下 的 
tn 是 算法 在 行 2 构造 M 和 在 行 4 通过 与 mm* 的 比较 处 理 A 和 In In 
DD 的 时 间 , 这 里 的 /是 某 个 常数 . 图 2.6 给 出 了 求解 该 方程 的 。 zw 
递归 树 . 于 是 得 到 : 区 :本 2 
Wn) Ztn t+ 0. nt 0.9nt+ 得 Tn Tn 49n ‘08m 
25 50 50 100 
二 tn(1 十 0.9 十 0. 9 十 …) 二 O(n) : 

从 上 面 的 分 析 可 以 看 出 ,这 样 找 的 m* 完全 满足 算法 要 图 2.6 递归 树 
求 ,两 次 递归 调用 的 参数 分 别 是 c=0.2,d=0.7, 而 c 十 4 
0.9 二 1, 这 使 得 Select 算法 可 以 把 时 间 复杂 度 降低 到 线性 时 间 . 

为 什么 分 组 时 选 5 个 元 素 ? 选 3 个 或 者 7 个 元 素 行 不 行 ? 这 是 一 个 有 趣 的 问题 . 元 素 
数 的 改变 可 能 会 改变 m* 的 特征 ,从 而 使 得 针对 某 些 分 组 方法 得 到 的 c 十 4 的 值 不 再 小 于 1， 
这 就 会 增加 算法 的 运行 时 间 . 有 兴趣 的 读者 不 妨 尝试 一 下 不 同 的 分 组 方法 . 到 此 为 止 ,我 们 
已 经 看 到 一 般 性 的 选择 问题 都 可 以 在 O(n) 时 间 内 求解 . 在 第 8 章 我 们 将 进一步 证 明 ,求解 
选择 问题 的 时 间 复 杂 度 最 低 的 算法 就 是 O(n) 时间 的 算法 . 


2.4.3 7 一 1 次 多 项 式 在 爹 体 2n 次 方 根 上 的 求 值 


设 A(z) 一 ao 十 aiz 十 azzz 十 … 十 aixz 是 一 个 2 一 1 次 多 项 式 , 对 给 定 的 z, 计 算 
A(z) 的 值 称 作 多 项 式 求 值 运算 . 这 里 考虑 的 不 是 对 任意 x 都 适用 的 通用 多 项 式 求 值 算法 ， 
而 是 对 1 在 复数 域 中 所 有 的 2n 次 方 根 进行 求 值 的 特定 算法 . 该 算法 已 经 在 实践 中 得 到 广泛 
的 应 用 ,例如 信号 处 理 的 滤波 运算 等 . 

先 回 顾 一 下 1 的 2n 次 方 根 的 概念 . 1 在 复数 域 上 开 2n 次 方 .得 到 2n 个 复数 根 ,这 些 根 


W() < w(#)+w( 


第 
在 复 平 面 上 构成 单位 圆 上 等 距离 分 布 的 2n 个 点 .一 般 地 可 以 表示 为 2 
wj ei er cos = 十 isin 二 ， 0,1,…，272 一 1 章 
其 中 i= V 一 1 是 虚数 单位 . 例如 二 4,1 的 8 次 方 根 是 : 
wo 一 1， 一 一 + 
oz exi 1， ws ei i 
ws er” 1， ws en 2 
wse 1， wr eT 2 0 
这 8 个 根 的 分 布 如 图 2.7 所 示 . 


给 定 多 项 式 
A(z) Qo 十 qz 二 azz 十 十 dix 
我 们 的 问题 是 对 上 述 定义 的 所 有 1 的 2n 次 方 根 w; 一 0,1， 
2,…,2n 一 1, 计 算 A(wj) 的 值 . 
考虑 下 面 的 算法 . 首先 想到 的 是 根据 定义 进行 计算 . 该 算 
法 的 伪 码 描述 如 下 : 
算法 2. 12 


输入 : 2 一 1 次 多 项 式 A 的 系数 ao ,al,… ,an-1 
输出 : AC(wo), ACan) ,ACwn1) 


图 2.7 1 的 8 次 方 根 


.计算 oo ,on se wan-1 
. for j<0 to 2n—1 do 


Vao 


1 

2 

3 

4. fori<l1 ton—l1 do 

5 tar wy // 计 算 A(z) 的 i 次 项 在 wj 的 值 
6 五 二 人 十 

和 


Teturn v 
算法 2. 12 在 行 5 做 i 次 乘法 ,因此 在 行 4 的 for 循环 中 总 计 做 
1 二名 二 FX 一 1 = N51/2 
次 乘法 , 这 只 是 对 1 的 一 个 2n 次 方 根 求 值 的 代价 ,考虑 所 有 的 2n 次 方 根 , 该 算法 的 时 间 复 
杂 度 是 O03). 
算法 2. 12 实质 上 属于 蛮 力 算法 , 它 没有 利用 前 面 计算 过 程 得 到 的 任何 有 用 信息 ,比如 
在 行 4 计 算 aw;' 时 ,需要 做 i 次 乘法 ,其 实 wj' 已 经 在 前 一 项 a;_-1w;”!' 的 计算 过 程 中 算 过 
了 .如果 能 够 利用 前 面 一 :的 值 ,计算 aiwj;' 只 需要 做 2 次 乘法 就 行 了 . 为 了 利用 前 面 计 算 
的 有 用 信息 , 先 要 搞 清楚 多 项 式 的 项 之 间 的 关系 . 考虑 下 面 的 系列 多 项 式 : 
Ai(Cz) 一 ar 
As(x) 一 ar 十 工 AiCZ) 
As (Cz) 一 Cars 十 工 Az(Cz) 
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Au,(z) 一 ao 十 ZA。i(Cz) 
从 上 面 的 关系 可 以 得 到 : 


A:(z) = ars+ rzA(z) = ars aniz 


As(z) = ars++zAs(x) 一 a ss 十 as 十 ariz2 


A,(z) 一 do 十 zA。 (zz) 一 ao 十 az 十 az 十 … 十 arcizrl 二 A(x) 

如 果 顺 序 求 值 多 项 式 A:(z),A:(z),…,A,(z), 最 后 得 到 的 就 是 A(Cz). 在 这 个 过 程 中 ， 
计算 Ai(z) 需 要 用 到 A;_1(x) 的 值 ,而 且 只 需要 1 次 乘法 和 1 次 加 法 ,这 是 常数 时 间 . 于 是 计 
算 整 个 多 项 式 序列 仅 需要 O(n) 时 间 . 但 这 是 计算 一 个 方 根 的 代价 ,考虑 到 所 有 2n 个 根 ,总 
的 时 间 达 到 OQ). 不 难看 出 ,这 个 算法 的 时 间 复 杂 度 比 起 算法 2. 12 有 明显 的 改善 . 

还 有 没有 更 好 的 算法 ? 利用 分 治 策略 可 以 得 到 O(nlogn) 时 间 的 更 好 的 算法 .为 了 说 清 
楚 算 法 的 设计 思想 , 先 看 一 个 简单 的 例子 . 

假设 n= 二 8, 多 项 式 是 : 

A(z) = a 二 azrt+asr 二 十 arx? 
我 们 需要 计算 A(z) 在 1 的 16 次 方 根 wo.w,… ,ws 上 的 值 . 考虑 下 面 两 个 多 项 式 : 


Ao(z) = qo aszar? 


3 
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Ai(z) Qi 十 as 工 十 as 
其 中 Au(z) 是 由 A(z) 中 下 标 是 偶数 的 系数 构成 ,Ai(z) 是 由 A(z) 中 下 标 是 奇数 的 系数 构 
成 .由 这 两 个 多 项 式 可 以 得 到 


Au(z2) 十 zzAli(z2) 一 (ao 十 azz2 十 az 十 aszs) 十 交 (ai 十 asz2 十 asz4 十 ayze) 


ao 十 az 十 azzz 十 … 十 azz 一 ACz) 


根据 这 个 关系 ,可 以 考虑 采取 下 面 步骤 进行 计算 : 

(1) 对 所 有 的 ww 计算 Au(ow) .Jj 一 0.1,…:,15; 

(2) 对 所 有 的 w 计算 Ai(o? ) .j= 二 0,1,…,15; 

(3) 对 所 有 的 ww 计算 Au(o; ) 十 ow * Ai(w?),j 二 0,1,…,15. 
在 上 述 计算 完成 后 就 得 到 所 有 的 A(w;), 其 中 j= 二 0,1,…,15. 

剩 下 的 问题 是 : 在 前 两 步 计 算 中 需要 ow ,这些 值 怎么 找 ? 这 不 难 做 到 , 因为 w; 是 1 的 
16 次 方 根 ,w? 恰好 是 1 的 8 次 方 根 , 换 句 话说 ,它们 满足 下 面 的 关系 : 


2 2 2 2 
wo Wo» ol Wa 2 Wa 3 We 
2 2 2 2 
[on Ws» WwW5 Wios ws Wi2zs WwW? Wi4* 
2 2 2 ! 
ws Wo» (ws Wa2» Wio Wa Cll We* 
2 2 2 2 
us mas Ws Wo Wi4 Was es Wi4 


正好 占 16 次 方 根 中 的 一 半 , 从 w 开始 . 隔 1 个 取 1 个 ,得 到 wo:os sw sw sw8 :wo oa ， 
正 是 求 值 两 个 子 问题 需要 的 8 个 方 根 . 

有 了 这 个 基础 ,可 以 得 到 一 个 分 治 算法 . (1) 和 (2) 的 计算 恰好 对 应 了 两 个 子 问题 ,输入 
规模 是 原 输 入 规模 的 一 半 . (3) 利 用 前 面 的 计算 结果 .只 需要 做 16 次 乘法 和 16 次 加 法 即 可 
(恰好 每 个 w; 做 1 次 乘法 和 1 次 加 法 ). 


把 上 述 设计 思想 推广 到 一 般 情 况 . 不 妨 设 ”为 偶数 , 设 要 求 值 的 多 项 式 是 : 


A(z) ao 十 ai 并 十 azz2z 十 … 十 ae ie 1 
令 
2 
Ao(Cz) ao 十 az 并 十 akz2 十 … 十 ao 2 并 
2 
Ai(xz) 十 QsX 十 Qs 十 十 QT 
那么 


A(z) 一 Ao(z2) 十 zAi(Cz2) 
根据 上 面 的 分 析 不 难 给 出 算法 的 伪 码 表示 ,这 里 不 再 袭 述 . 为 了 在 算法 分 析 过 程 中 表达 得 更 
简单 和 清晰 ,我们 忽略 一 些 实现 细节 ,不 妨 假设 一 关 , 那 么 关于 该 算法 时 间 复 杂 度 的 递 推 
方程 是 : 


Tl(n) = Ti(n) + fn) 


Ti(n) = 2T, 但)j+scm 


T1(1) = O(1) 
其 中 Fo) 是 初始 计算 所 有 的 2n 次 方 根 的 时 间 , 这 个 时 间 与 nn 成 正比 ,于 是 f(n) = 二 O(n). 
g(n) 是 算法 对 所 有 的 j, 通 过 Ao( 吧 ) 和 Ai(wi) 的 值 计算 A(wj) 的 时 间 . 对 于 给 定 的 j ,需要 
常数 时 间 , 所 有 的 j 共 需 要 g(n) 二 O(n) 时 间 . 于 是 根据 主 定理 得 到 : 


Ti(n) = 2T, 位 ooo=mon = O(nlogn) 


T(n) = Ti(n)+O(n) = O(nlogn) + O(n) = O(nlogn) 

这 真是 分 治 策略 的 一 个 成 功 的 范例 ,在 所 有 的 2n 次 方 根 上 进行 n 一 1 次 多 项 式 的 求 值 ， 
居然 只 用 了 O(nlogn) 时 间 . 

通过 这 么 多 的 例子 ,我们 已 经 对 分 治 策略 有 了 较 多 的 认识 ,这 是 一 种 常见 的 算法 设计 技 
术 ,在 许多 问题 上 都 得 到 广泛 的 应 用 . 最 简单 的 分 治 法 就 是 通常 的 二 分 法 ,当然 也 可 以 设计 
三 分 法 或 者 更 复杂 的 划分 方法 . 对 输入 集合 的 划分 一 般 采 用 均衡 的 原则 ,但 分 治 算法 归 约 成 
的 子 问题 不 一 定 是 对 输入 集合 进行 简单 划分 的 结果 ,比如 前 面 看 到 的 Select 算法 和 多 项 式 
求 值 算法 .它们 的 设计 中 都 用 到 了 更 多 的 技巧 . 不 管 采用 什么 方法 归 约 ,所 得 到 的 子 问题 必 
须 与 原 问题 的 类 型 是 一 样 的 ,而 且 子 问题 之 间 是 互相 独立 的 . 分 治 算法 的 分 析 技 术 通常 是 转 
化 为 求解 时 间 复 杂 度 郴 数 的 递 推 方程 , 主 定理 .和 迭代 法 .递归 树 等 是 常用 的 求解 方法 . 提高 算 
法 效率 的 有 效 途径 是 减少 子 问题 个 数 和 增加 预 处 理 以 减少 递归 计算 ,在 设计 算法 的 伪 码 时 
需要 注意 子 问题 的 边界 . 


习 题 2 


对 于 本 章 与 算法 设计 有 关 的 习题 , 解 题 要 求 如 下 : 先 用 一 段 简短 的 文字 说 明 算 法 的 主 
要 设计 思想 ,其 中 所 引入 的 符号 要 给 出 必要 的 说 明 ,是 否 给 出 伪 码 根据 题目 要 求 确定 . 可 以 
调用 书 上 的 算法 作为 子 过 程 , 最 后 对 所 设计 的 算法 需要 给 出 最 坏 情况 下 时 间 复 杂 度 的 分 析 . 
2.1 设 输入 是 nn 个 数 的 数组 A[1..nj, 下 述 排 序 算 法 是 插入 排序 . 

算法 InsertSort(A) 


1. fori<-2 tondo 
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~ 


上 zeA[i]; 

3. ji—1; 

4. while j>0 and A[j]>zx do 
5. A[Lj+1]<-A[j] 

6. jj—1 

人 A[j+1]<z 


改进 上 述 算法 ,在 插入 元 素 A[ 门 时 用 二 分 查找 代 蔡 顺序 查找 ,将 这 个 算法 记 作 

ModInsertSort, 给 出 该 算法 的 伪 码 ,并 估计 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 . 

设 A 是 由 n 个 非 0 实数 构成 的 数组 ,设计 一 个 算法 重新 排列 数组 的 数 ,使 得 负数 都 排 

在 正 数 的 前 面 . 要 求 算法 使 用 O(n) 的 时 间 和 O(1) 的 空间 . 

双 Hanoi 塔 问 题 是 Hanoi 塔 问题 的 一 种 推广 ,与 Hanoi 塔 的 不 同 点 在 于 : 2n 个 圆 盘 ， 

分 成 大 小 不 同 的 nn 对 ,每 对 圆 盘 完 全 相同 . 初始 ,这 些 圆 盘 按照 从 大 到 小 的 次 序 从 下 到 

上 放 在 A 柱 上 ,最 终 要 把 它们 全 部 移 到 C 柱 ,移动 的 规则 与 Hanoi 塔 相 同 . 

(1) 设计 一 个 移动 的 算法 并 给 出 伪 码 描述 . 

(2) 计算 你 的 算法 所 需要 的 移动 次 数 . 

给 定 含 有 ?7 个 不 同 的 数 的 数组 荆 王 二 zi ,zxs，… ,xz 二 . 如 果 工 中 存在 xz; 使 得 zi 一 

2 < …<zri<zizirHi…>z, 则 称 志 是 单 峰 的 ,并 称 zi 是 工 的 “ 峰 顶 ”假设 LL 是 

单 峰 的 ,设计 一 个 算法 找到 工 的 峰 顶 . 

设 A 是 nn 个 不 同 的 数 排 好 序 的 数组 ,给 定数 工种,L=U ,设计 一 个 算法 找到 A 中 满 

足 荆 一 zz 一 U 的 所 有 的 数 工 . 

设 M 是 一 个 n 行 n 列 的 0-1 和 矩阵 ,每 行 的 1 都 排 在 0 的 前 面 . 

(1) 设计 一 个 最 坏 情 况 下 O(nlogn) 时 间 的 算法 找到 M 中 含有 1 最 多 的 行 ,说 明 算 法 
的 设计 思想 ,估计 最 坏 情 况 下 的 时 间 复 杂 度 . 

(2) 对 上 述 问 题 ,能 否 找 到 一 个 最 坏 情况 下 O(n) 时 间 的 算法 ? 

设 A 是 含有 n 个 元 素 的 数组 ,如 果 元 素 z 在 A 出 现 的 次 数 大 于 nn/2, 则 称 z 是 A 的 主 

元 素 . 

(1) 如 果 A 中 元 素 是 可 以 排序 的 ,设计 一 个 O(nlogn) 时 间 的 算法 ,判断 A 中 是 否 存在 
主 元 素 . 

(2) 对 于 (1) 中 可 排序 的 数组 ,能 否 设计 一 个 O(n) 时 间 的 算法 ? 

(3) 如 果 A 中 元 素 只 能 进行 “是 否 相 等 ”的 测试 ,但 是 不 能 排序 ,设计 一 个 算法 判断 
A 中 是 否 存 在 主 元 素 . 

设 A 和 B 都 是 从 小 到 大 已 经 排 好 序 的 n 个 不 等 的 整数 构成 的 数组 ,如 果 把 A 与 B 合 

并 后 的 数组 记 作 C ,设计 一 个 算法 找 出 C 的 中 位 数 . 

在 n(n 宇 3) 枚 硬币 中 有 一 枚 重量 不 合格 的 硬币 (重量 过 轻 或 者 过 重 ) ,如 果 只 有 一 架 天 

平 可 以 用 来 称 重 且 称 重 的 硬币 数 没有 限制 ,设计 一 个 算法 找 出 这 枚 不 合格 的 硬币 ,使 

得 称 重 的 次 数 最 少 ? 给 出 算法 的 伪 码 描述 . 如 果 每 称 1 次 就 作为 1 次 基本 运算 ,分 析 

算法 的 最 坏 情况 下 的 时 间 复 杂 度 . 


.10 考虑 下 述 n 阶 和 矩阵 乘法 的 分 治 算法 : 将 nXn 甜 阵 顺序 划分 成 n/3Xn/3 块 .每 块 为 
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3X3 的 小 矩阵 . 假设 两 个 3X3 的 小 矩阵 相 乘 可 以 用 A 次 数 的 乘法 运算 完成 (4 为 固 
定 正 整 数 ) ,原来 规模 为 n 的 问题 就 可 以 归结 为 规模 为 n/3 的 子 问 题 . 设 上 述 算法 的 
时 间 复 杂 性 函数 为 T(n). 

(1) 列 出 关于 T(x) 的 递 推 方程 并 估计 T(Cz) 的 阶 . 

(2) & 最 大 取 什 么 值 能 够 使 得 了 (zz) 一 oCzee )? 

设 P(z) 王 ao 十 az 十 azzz 十 … 十 aiz 十 xz 是 最 高 次 项 系数 为 1 的 nn 次 多 项 式 ， 
使 得 P(x)==0 的 数 xz 称 为 该 多 项 式 的 根 .假设 存在 算法 A 和 B, 其 中 A 可 以 在 OC(k) 
时 间 内 计算 一 个 & 次 多 项 式 与 一 个 1 次 多 项 式 的 乘积 ;B 可 以 在 O(ilogi) 时 间 内 计 
算 两 个 i 次 多 项 式 的 乘积 . 利用 算法 A 和 B 设计 一 个 分 治 算法 确定 以 给 定 整 数 d)， 
ds，…,d, 为 根 的 n 次 多 项 式 P(xz). 

设 A={aisas，"… aw},B 二 {b ,bs，…,bm} 是 整数 集合 , 其 中 汶 二 O(logn). 设计 一 个 
算法 找 出 集合 C= 二 ANB. 要 求 给 出 伪 码 描述 . 

考虑 算法 2. 11 的 Select 算法 . 

(1) 如 果 初 始 的 元 素 分 组 采用 3 个 一 组 ,算法 的 时 间 复 杂 度 将 是 多 少 ? 

(2) 如 果 初 始 的 元 素 分 组 采用 7 个 一 组 ,算法 的 时 间 复 杂 度 将 是 多 少 ? 

设 S 是 n 个 不 等 的 正 整 数 的 集合 ,n 为 偶数 . 给 出 一 个 算法 将 S 划分 成 子 集 S; 和 5S,， 
使 得 |S11==15;1=n/2, 且 
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达到 最 大 ,即使 得 两 个 子 集 元 素 之 和 的 差 达到 最 大 . 
给 定 7 个 不 同 数 的 数组 S 和 正 整 数 i ,i 过 m“, 求 S 中 最 大 的 :个 数 , 并 且 按照 从 大 到 
小 的 次 序 输出 . 有 下 述 算法 : 
算法 A: 调用 i 次 找 最 大 算法 Findmax, 每 次 从 S 中 删除 一 个 最 大 的 数 . 
算法 B: 对 S 排序 ,并 输出 S 中 最 大 的 i 个 数 . 
(1) 分 析 A,B 两 个 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 . 
(2) 试 设计 一 个 最 坏 情 况 下 时 间 复 杂 度 的 阶 更 低 的 算法 ,要 求 给 出 伪 码 . 
设 5 为 n 个 不 同 数 的 集合 ， 
(1) 设计 算法 找 出 S 中 的 数 x 和 y 使 得 Yu,v€S,|zx 一 y| 宇 lu 一 v|. 
(2) 设计 算法 找 出 S 中 的 数 x 和 y 使 得 Yu,v€S,|x 一 y| 三 Iu 一 vl. 
给 定 n 个 不 等 的 整数 构成 的 集合 L 和 整数 ; ,设计 一 个 算法 判断 在 工 中 是 否 存 在 两 
个 整数 z 和 y(zr 二 y) ,满足 zx 十 y= 二 s. 以 加 法 运算 作为 基本 运算 分 析 你 的 算法 在 最 坏 
情况 下 的 时 间 复 杂 度 . 
设 平面 直角 坐标 系 中 及 个 点 (zi sy1) 《zz yz) (Cryyw) ,每 个 点 到 原点 (0,0) 的 
距离 彼此 不 等 .设计 一 个 算法 找到 距离 原点 (0.0) 最 近 的 [Wn 个 点 ,并 按照 距 原点 从 
远 到 近 的 顺序 输出 点 的 标号 . 要 求 给 出 伪 码 描述 . 
设 A 是 n 个 不 等 的 整数 数组 ,n 二 2, 设计 一 个 分 治 算法 找 出 A 中 的 最 大 数 mazx 和 
最 小 数 min. 要 求 给 出 伪 码 描述 . 
有 nn 个 人 ,其 中 某 些 人 是 诚实 的 .其 他 人 可 能 会 说 谎 . 现在 需要 进行 一 项 调查 ,该 调查 
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由 一 系列 测试 构成 . 每 次 测试 如 下 进行 : 选 两 个 人 ,然后 提问 : 对 方 是 否 诚实 ? 每 个 
人 的 回答 只 能 是 “是 ”或 者 “ 否 ”. 假定 在 这 些 人 中 ,所 有 诚实 的 人 回答 都 是 正确 的 ,而 
其 他 人 的 回答 则 不 能 肯定 是 否 正确 . 如 果 诚 实 的 人 数 之 x/2. 试 设计 一 个 调查 算法 ， 
以 最 小 的 测试 次 数 从 其 中 找 出 一 个 诚实 的 人 . 

多 选 问 题 : 设 S 是 n 个 不 等 的 数 的 集合 ,对 于 给 定 的 整数 ~,1 委 r 委 7 天 一 { 语 ,as，…， 
k,) 是 7 个 正 整 数 的 集合 ,其 中 ] 委 包 二 忆捷 … 一 包 委 交 请 设计 算法 在 S 中 找 出 第 小 、 
第 小、…、 第 k, 小 的 r 个 元 素 . 例如 r=3,K={2,4,7}), 则 输出 S 的 第 2 小 .第 4 
小 ,第 7 小 的 元 素 . 不 难看 出 , 当 一 1 时 ,该 问题 就 是 一 般 的 选择 问题 , 当 r==n 时 ,该 
问题 就 变 成 了 排序 问题 . 

(1) 设计 一 个 最 坏 情况 下 时 间 复 杂 度 为 O(nr) 的 算法 . 

(2) 若 一 1, 设计 一 个 最 坏 情 况 下 时 间 复 杂 度 为 O(nlogr) 的 算法 . 

设 A={ai,az,… ,av}, 了 一 (六 ,0 ,bo } 是 整数 集合 ,其 中 入 天 O(logz).， 设计 算法 
计算 集合 C= (4A 一 B)U(CB 一 A) ,说 明 算 法 的 主要 步骤 ,并 以 比较 作 基 本 运算 分 析 算 
法 最 坏 情况 下 的 时 间 复 杂 度 . 

设 A 是 nn 个 数 的 序列 ,如 果 A 中 的 元 素 x 满足 以 下 条 件 :小 于 zx 的 数 的 个 数 宇 n/4， 
且 大 于 x 的 数 的 个 数 三 n/4, 则 称 z 为 A 的 近似 中 值 . 设计 算法 求 出 A 的 一 个 近似 
中 值 . 说 明 算法 的 设计 思想 和 最 坏 情况 下 的 时 间 复 杂 度 . 

设 A 是 n 个 数 构成 的 数组 ,其 中 出 现 次 数 最 多 的 数 称 为 众 数 ,设计 一 个 算法 求 A 的 
众 数 ,给 出 伪 码 和 最 坏 情况 下 的 时 间 复 杂 度 . 

一 个 实验 可 得 出 个 不 同 的 值 .分 别 用 数 zi ,zs,，… ,x 表示 . 已 知 zx; 出 现 的 概率 
是 pi,i 二 1,2,…,n, 且 所 有 概率 之 和 等 于 1. 试 设计 一 个 算法 找到 值 x ,使 得 所 有 小 
于 xx 的 值 出 现 的 概率 之 和 不 超过 1/2, 且 所 有 大 于 x 的 值 出 现 的 概率 之 和 也 不 超 
过 1/2. 例如 ,实验 结果 为 :zi 二 2, xz, 二 1, zs 二 4, zx 二 3, Xs 二 5, 出 现 的 概率 依次 为 
pi 二 0.2, pz 二 0.4, ps 二 0.1, ps 二 0.1, ps 二 0.2, 那么 xz! 就 是 所 求 的 值 ， 比 zi 小 
的 数 只 有 zx, 它 的 概率 是 0.4; 比 zx 大 的 数 有 zs ,xs 和 zs ,它们 的 概率 之 和 是 0.4. 
说 明 算 法 的 设计 思想 ,估计 算法 最 坏 情 况 下 的 时 间 复 杂 度 . 

某 石油 公司 计划 建造 一 条 由 东 向 西 的 输油管 道 ,该 管道 要 穿 过 一 个 及 口 油井 的 油 
田 . 从 每 口 油井 都 要 有 一 条 输油管 道 沿 最 短路 径 ( 南 北方 向 ) 与 主管 道 相连 . 如 果 给 定 
n 口 油井 的 位 置 , 即 它 们 的 xz 坐标 和 y 坐标 . 设计 一 个 算法 来 确定 主管 道 的 位 置 ,使 
得 每 口 油井 到 主管 道 之 间 的 输油管 道 长 度 之 和 达到 最 小 ? 

如 图 2. 8 所 示 , 城 市 街道 都 是 水 平 或 垂直 分 布 ,有 mm 十 1 条 ,不 妨 设 任何 两 个 相 邻 位 
置 之 间 的 距离 都 是 1. 在 街道 的 十 字 路 口 有 个 商店 ,图 中 的 n= 二 3,m 二 8,3 个 商店 
的 坐标 位 置 ( 图 中 的 圆 点 ) 分 别 是 (2,4),(5,3),(6,6). 现在 需要 在 某 个 路 口 位 置 建 
一 个 合用 的 仓库 . 车 仓库 选择 (3,5) 位 置 ,那么 这 3 个 商店 到 仓库 的 路 程 (只 能 沿街 
道行 进 ) 总 长 至 少 是 10. 设计 一 个 算法 找到 仓库 的 最 佳 位 置 . 使 得 所 有 商店 到 仓库 路 
程 的 总 长 达到 最 短 . 
在 Internet 上 的 搜索 引擎 经 常 需要 对 信息 进行 比较 ,比如 可 以 通过 某 个 人 对 一 些 事 
物 的 排名 来 估计 他 对 各 种 不 同 信息 的 兴趣 .从 而 实现 个 性 化 的 服务 . 对 于 不 同 的 排名 
结果 可 以 用 逆序 来 评价 它们 之 间 的 差异 . 考虑 1,2,…,n 的 排列 iaz…z ,如 果 其 中 存 
在 宫 , 六 ,使 得 j<A 但 是 去 二 站: 那么 就 称 ( 姜 , 关 ) 是 这 个 排列 的 一 个 逆序 . 一 个 排列 含 
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(0, 8) (8, 8) 
中 
(0, 0) (8.0) 
图 2.8 街道 图 
有 北 序 的 个 数 称 为 这 个 排列 的 逆序 数 . 例如 排列 2 6 3 4 5 1 含有 8 个 道 序 (2,1)， 


(6,3),(6,4),(6,5),(6,1),(3,1),(4,1),(5,1), 它 的 逆序 数 就 是 8. 显然 ,由 1， 

2,…,n 构成 的 所 有 nn! 个 排列 中 ,最 小 的 道 序 数 是 0, 对 应 的 排列 就 是 12…n; 最 大 的 

道 序数 是 n(n 一 1)/2, 对 应 的 排列 就 是 n(n 一 1)…21. 道 序 数 越 大 的 排列 与 原始 排列 

的 差异 度 就 越 大 . 

利用 二 分 归并 排序 算法 设计 一 个 计数 给 定 排列 逆序 的 分 治 算 法 ,并 对 算法 进行 时 间 

复杂 度 的 分 析 . 

每 个 镍 母 需要 和 1 个 锋 栓 配套 使 用 .现在 有 nn 种 不 同 尺寸 的 猎 母 与 御 栓 ,恰好 可 以 配 

成 nn 套 .设计 一 个 平均 复杂 度 最 低 的 算法 ,尽快 为 每 个 儿 母 找到 与 之 配套 的 猎 栓 . 该 

算法 的 1 次 基本 运算 是 : 把 1 个 猎 母 尝试 与 1 个 锋 栓 匹配 ,看 看 它们 是 否 合适 . 尝试 

结果 只 能 是 以 下 三 种 之 一 : 锋 母 大 于 猕 栓 , 锋 母 小 于 猎 栓 ,或 者 恰好 配套 . 注意 : 该 

算法 不 能 比较 两 个 猕 栓 的 大 小 ,也 不 能 比较 两 个 猎 母 的 大 小 . 

(1) 用 文字 说 明 算法 的 设计 思想 ; 

(2) 分 别 给 出 算法 在 最 坏 和 平均 情况 下 的 时 间 复 杂 度 Wn) 和 An). 

对 玻璃 瓶 做 强度 测试 . 设 地 面 高 度 为 0, 从 0 向 上 有 个 高 度 , 记 为 1,2,…,n, 其 中 任 

何 两 个 高 度 之 间 的 距离 都 相等 . 如 果 一 个 玻璃 瓶 从 高 度 i 落 到 地 上 没有 摔 破 ,但 从 高 

度 ;十 1 落 到 地 上 摔 破 了 .那么 就 将 玻璃 瓶 的 强度 记 为 i. 

(1) 假设 每 种 玻璃 瓶 只 有 1 个 测试 样品 ,设计 算法 来 测 出 每 种 玻璃 瓶 的 强度 . 以 测试 

次 数 作为 算法 最 坏 情况 下 的 时 间 复 杂 度 量度 ,对 算法 最 坏 时 间 复 杂 度 做 出 估计 . 

假设 每 种 玻璃 瓶 有 足够 多 的 相同 的 测试 样品 ,设计 算法 使 用 最 少 的 测试 次 数 来 

完成 测试 . 该 算法 最 坏 情 况 下 的 时 间 复 杂 度 是 多 少 ? 

(3) 假设 每 种 玻璃 瓶 只 有 2 个 相同 的 测试 样品 (4 一 2) ,设计 次 数 尽 可 能 少 的 算法 完 
成 测试 . 你 的 算法 最 坏 情况 下 的 时 间 复 杂 度 是 多 少 ? 

(4) 尝试 将 (3) 中 的 方法 推广 到 其 他 任意 给 定 的 &CA 二 2) 的 情况 ,其 中 & 代表 测试 样 
品 的 个 数 . 
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第 章 
动态 规划 


动态 规划 (Dynamic Programming) 技 术 已 经 广泛 应 用 于 许多 组 合 优化 问题 的 算法 设计 
中 ,比如 图 的 多 起 点 与 多 终点 的 最 短路 径 问题 .矩阵 链 的 乘法 问题 ,最 大 效益 投资 问题 背包 
问题 .最 长 公共 子 序列 问题 图像 压 缩 问 题 .最 大 子 段 和 问题 、 最 优 二 分 检索 树 问题 .RNA 的 
最 优 二 级 结构 问题 等 . 

一 般 的 组 合 优化 问题 都 有 对 应 的 目标 函数 和 约束 条 件 . 例如 第 1 这 提 到 的 党 闻 问题 设 
C= {ccs scm} 是 城市 集合 ,距离 d(ci,cj)==d(cj sc) EZVt+ ,1 二 i 过 j 二 mr. 求 1,2,…,m 的 
排列 A， dil 使 得 旅行 路 线 最 短 , 即 


min{ Sa Ch) al. Cu )} 
其 中 Sa,, rk) 十 dlcs wcn) 称 为 目标 函数 ,约束 条 件 是 ,ks，…,k。 必须 构成 1， 
2 7 -的 排列 . 组 合 优化 问题 的 解 分 布 在 搜索 空间 中 ,其 中 满足 约束 条 件 的 解 称 为 可 行 
解 , 而 在 可 行 解 中 使 得 目标 函数 达到 最 小 (或 最 大 ) 值 的 解 称 为 最 优 解 ,比如 货 郎 问题 需要 找 
到 最 短 的 旅行 路 线 ,是 极 小 化 问题 ,而 背包 问题 需要 找到 一 组 能 够 放 和 人 背包 并 且 使 背包 价值 
达到 最 大 的 物品 ,是 极 大 化 问题 . 所 谓 求 解 组 合 优化 问题 就 是 找到 该 问题 的 最 优 和解. 
实践 中 的 组 合 优化 问题 的 搜索 空间 往往 比较 大 ,由 于 中 间 有 许多 重复 计算 ,很 多 都 是 指 
数量 级 的 . 蛮 力 算法 对 于 规模 较 大 的 问题 实际 上 是 不 可 能 运行 的 . 动态 规划 技术 把 求解 过 程 
变 成 一 个 多 步 判断 的 过 程 ,每 一 步 都 对 应 于 某 个 子 问题 . 算法 细心 地 划分 子 问题 的 边界 ,从 
小 的 子 问 题 开 始 , 逐 层 向 上 求解 . 通过 子 问 题 之 间 的 依赖 关系 ,有 效 利 用 前 面 已 经 得 到 的 结 
果 , 最 大 限度 减少 重复 工作 ,以 提高 算法 效率 . 对 于 许多 蛮 力 算法 是 指数 时 间 的 问题 .动态 规 
划 技 术 都 取得 了 突破 进展 ,将 时 间 复 杂 度 降 到 O(02 ) 或 002 ) 等 多 项 式 级 别 .但 是 ,任何 一 种 算 
法 设计 技术 都 有 一 定 的 适用 范围 ,动态 规划 技术 需要 较 大 的 存储 空间 来 存储 子 问题 计算 的 中 
间 结 果 , 以 备 后 面 使 用 . 对 于 输入 规模 很 大 的 情况 .这 个 代价 可 能 比 时 间 的 消耗 更 难于 承受 . 


3.1 动态 规划 的 设计 思想 


为 了 理解 动态 规划 的 基本 思想 , 先 看 一 个 简单 的 例子 . 
3.1.1 多 起 点 、 多 终点 的 最 短路 径 问 题 
例 3.1 在 实际 中 经 常会 遇 到 路 径 选择 问题 . 如 图 3.1 所 示 , 有 5 个 起 点 Si，…，,S;， 


动态 规划 


5 个 终点 Tl,… ,Ts; ,其 余 结 点 是 途经 结 点 . 结 点 之 间 用 边 连 接 , 边 上 的 整数 表示 长 度 . 从 起 
点 Si 可 以 通过 4 条 从 左 到 右 的 边 Si 一 Aij 一 Bi 一 C' 一 T。 而 到 达 终 点 T。 ,这 就 是 一 条 从 起 点 
Si 到 终点 T。 的 路 径 , 路 径 的 长 度 就 是 这 4 条 边 的 长 度 之 和 .我 们 的 问题 是 : 给 定 道路 图 ， 
在 所 有 起 点 到 终点 的 路 径 中 找 一 条 长 度 最 短 的 路 径 . 


图 3.1 道路 图 


求解 这 个 问题 的 蛮 力 算法 就 是 穷 举 每 一 个 起 点 到 每 一 个 终点 的 所 有 可 能 的 路 径 , 然 后 
计算 每 条 路 径 的 长 度 , 从 中 找 出 最 短路 径 . 每 条 路 径 由 4 条 边 构成 ,除了 最 上 边 和 最 下 边 的 
某 些 结 点 外 ,处 于 中 间 的 结 点 都 有 2 条 边 可 选 ,于 是 ,从 起 点 出 发 的 路 径 大致 达 到 OCm2") 量 
级 ,其 中 为 起 点 个 数 ,n 为 每 条 路 径 的 长 度 , 也 就 是 路 网 的 层 数 . 

下 面 用 动态 规划 方法 求解 这 个 问题 . 从 终点 向 起 点 回 推 ,把 求解 过 程 分 成 4 步 ,每 一 步 
对 应 的 子 问 题 的 终点 不 变 , 但 起 点 逐步 前 移 , 使 得 前 步 已 经 求解 的 问题 恰好 是 后 面 新 问题 的 
子 问题 ,到 最 后 一 步 求解 的 最 大 的 子 问 题 正 好 是 原始 问题 . 具体 来 说 ,所 有 子 问题 的 终点 都 
是 TCm 二 1,2,3,4,5) ,但 起 点 不 同 . 第 一 步 对 应 子 问题 的 起 点 是 C,(1 二 1,2,3,4), 第 二 步 
对 应 子 问题 的 起 点 是 Bi(k 二 1,2,3,4,5) ,第 三 步 对 应 子 问 题 的 起 点 是 A; (j= 二 1,2,3,4), 第 
四 步 对 应 子 问题 的 起 点 是 S;(i 二 1,2,3,4,5). 这 实际 上 就 是 原始 问题 . 在 每 一 步 需要 求解 的 
是 : 从 当前 起 点 到 终点 的 最 短路 径 及 其 长 度 . 

第 一 步 要 确定 从 任何 C, 到 终点 的 最 短路 径 . 先 看 C,, 到 终点 只 有 两 条 路 ,向 上 走 到 
或 向 下 走 到 T;, 令 F(C) 表 示 从 Ci 到 终点 的 最 短路 径 长 度 , 于 是 

F(C) = min(CiT CT = min{2,5} = 2 
把 这 个 结果 标记 在 Ci 的 上 方 , 记 作 “u,2”, 其 中 4 表示 到 终点 的 最 短路 应 该 “向 上 ”,2 表示 
这 条 最 短路 的 长 度 . 接着 考虑 C:. 与 在 CG 所 做 的 判断 类 似 , 可 以 在 Cs 标记 为 “4,3”, 其 中 
“qd” 表 示 到 终点 的 最 短路 应 该 “向 下 ”. 同样 的 可 以 把 Cs 和 C 依次 标记 为 *u,7”( 或 “d ,7”， 
因为 向 下 与 向 上 的 路 径 一 样 长 ) 和“u.,1”. 到 此 为 止 第 一 步 的 判断 全 部 完成 . 在 这 一 步 判断 
中 使 用 的 只 是 从 C, 到 了 T,。 所 有 可 能 的 边 长 . 如 果 以 F(C,) 表 示 从 Ci 到 终点 的 最 短路 径 的 长 
度 ,那么 判断 公式 是 : 


F(C) = min{CT。》 
第 二 步 要 确定 从 任何 Bs 到 终点 的 最 短路 径 . 先 看 Bi ,从 Bi 只 能 向 下 到 Ci ,接着 从 
GC 走 最 短路 到 终点 . 于 是 
F(B) = BiCi+F(C) = 9+2= 11 
把 这 个 结果 标记 在 B 的 上 方 , 记 作 “d ,11”. 接着 考虑 B:. 与 在 B; 所 做 的 不 同 ,从 Bs 既 可 以 
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到 C, ,后 接 从 Ci 到 终点 的 最 短路 ;也 可 以 先 到 Cs ,后 接 从 C, 到 终点 的 最 短路 . 这 两 条 中 哪 
条 更 短 ,就 应 该 选 哪 条 . 于 是 从 B。 出 发 到 终点 的 最 短路 长 度 应 该 是 ， 
F(B;) = min{(B:C + F(C),BCs 十 下 (CC )} 上 三 min(3 十 2,6 十 3) 王 5 
这 是 选择 先 向 上 走 的 结果 ,因此 在 B 标记 为 “4.5”. 同样 地 可 以 把 B,,B, 和 Bs 依次 标记 为 
“7”"*d,5" 和 "usd". 到 此 为 止 第 二 步 的 判断 全 部 完成 . 在 这 一 步 判断 中 使 用 的 信息 是 : 从 
B 到 C, 所 有 可 能 的 边 长 以 及 上 一 步 所 做 的 标记 . 递 推 的 判断 公式 是 ， 
F(B:) 一 min{ BiC, FG 
类 似 地 可 以 完成 后 面 两 步 的 判断 过 程 ,相关 的 递 推 公式 给 在 下 面 ， 
F(A;) = min{AjB. 十 F(B,)} 


F(S;) = min{S:A; + F(A,)} 
各 步 判 断 所 做 的 标记 给 在 图 3. 2 中 . 到 全 部 判断 完成 以 后 ,从 起 点 到 终点 的 最 短路 径 已 经 找 
到 了 . 观察 在 S, ,S;,… ,Ss 的 标记 ,最 短路 的 长 度 是 10, 一 条 从 S; 开始 ,追寻 标记 “d” 向 下 
到 As ,接着 按 As 处 的 标记 ”qd 向 下 到 B ,再 按 Bs 处 的 标记 ”qd "向 下 到 C;， 最 后 按 C4 处 的 
标记 “uw” 向 上 到 T,. 还 有 另 一 条 是 : S; ,A,，B,.C;,T. 两 条 最 短路 径 都 用 粗 线 在 图 3. 2 中 
标 出 . 


dl5 dll 
中 


图 3.2 结 点 的 标记 及 最 短路 


与 蛮 力 算法 相 比 , 这 种 算法 的 好 处 是 : 在 判断 时 只 考虑 由 前 面子 问题 的 最 优 解 (是 当前 
子 问题 最 优 解 的 组 成 部 分 ) 可 能 的 延伸 结果 ,从 而 把 许多 不 可 能 成 为 最 优 解 的 部 分 路 径 尽早 
从 搜索 中 删除 ,因此 能 够 提高 效率 . 根据 上 面 的 递 推 公式 , 除 终点 外 ,对 每 个 结 点 只 需要 做 
2 次 加 法 (对 Ci 层 结 点 不 做 加 法 ) 和 1 次 比较 .因此 算法 的 时 间 复 杂 度 可 以 降 到 O(n) ,其 
中 m 代表 每 层 的 结 点 个 数 ,n 是 层 数 . 


3.1.2 使 用 动态 规划 技术 的 必要 条 件 


先 把 上 面 的 最 短路 径 问 题 的 动态 规划 算法 简单 总 结 一 下 ,其 主要 特征 是 : 求解 的 问题 
是 多 阶段 决策 (优化 ) 问 题 ; 求 解 过 程 是 多 步 判 断 , 从 小 到 大 依次 求解 每 个 子 问题 ,最 后 求解 
的 子 问题 就 是 原始 问题 . 子 问 题目 标 函 数 的 最 小 值 之 间 存 在 依赖 关系 .将 子 问 题 的 解 记录 下 
来 ,以 备 后 面 求解 时 使 用 . 其 中 关于 子 问题 目标 函数 的 最 小 值 之 间 的 依赖 关系 是 最 关键 的 . 
这 一 条 称 为 优化 原则 或 最 优 子 结构 性 质 . 更 清晰 的 表述 是 : 

优化 原则 : 一 个 最 优 决策 序列 的 任何 子 序列 本 身 一 定 是 相对 于 子 序列 的 初始 和 结束 状 
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态 的 最 优 的 决策 序列 . 

正 是 由 于 优化 原则 ,在 考虑 后 面 较 大 子 问 题 的 最 优 解 时 ,只 需 考虑 它 的 子 问 题 的 最 优 解 
所 延伸 的 结果 . 需要 注意 的 是 : 在 实践 中 并 不 是 所 有 的 组 合 优化 问题 都 适用 于 优化 原则 ,有 
时 对 某 个 子 问题 的 解 不 一 定 达 到 最 优 ,但 是 当 把 它 延 伸 成 整个 问题 的 解 时 反而 成 了 最 优 解 . 
如 果 对 这 样 的 问题 使 用 动态 规划 技术 ,就 可 能 出 错 . 下 面 是 一 个 简单 的 例子 . 
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例 3.2 求 总 长 模 10 的 最 短路 径 . 1 2 ue 2 4 2 42 2 
如 图 3.3 所 示 ,S 是 起 点 ,了 是 终点 , 边 上 的 数 5 小 潜 发 7 
字 代 表 道 路 的 长 度 . 与 例 3. 1 类 似 ,我 们 需要 找 出 3 3 3 , 


从 S 到 工 的 模 10 意义 下 的 最 短路 径 . 这 里 的 模 ”图 3.3 一 个 不 满足 优化 原则 的 反例 
10 指 的 是 除 以 10 得 到 的 余数 . 
采用 和 例 3. 1 一 样 的 动态 规划 算法 . 首先 计算 从 C 到 工 的 模 10 最 短路 径 ， 
F(C) = min{2mod10, 5mod10} = min{2,5} = 2 
在 C 的 上 方 标注 *u,2”. 第 二 步 计算 从 B 到 TT 的 模 10 最 短路 径 : 
F(B) = min{(2++ F(C))mod10, (5+ F(C))mod10} = min{4,7} = 4 
在 B 的 上 方 标注 "4,4”. 第 三 步 计 算 从 A 到 了 的 模 10 最 短路 径 : 
F(A) = min{(2+ F(B))modl10, (5++ F(B))modl10} = min{6,9} = 6 
在 A 的 上 方 标注 <vw,6”. 最 后 计算 从 S 到 工 的 模 10 最 短路 径 : 
F(S) = min{(2++ F(A))mod10, (5+ F(A))mod10} = min{8,1} = 1 
于 是 得 到 S 上 方 的 标记 *d ,1”. 从 而 找到 该 实例 的 一 个 解 , 即 沿 * 下 、 上 、 上 、 上 ”的 方向 从 
S 走 到 了 ,路 径 模 10 的 长 度 为 1. 简单 地 观察 就 可 以 发 现 ,这 不 是 最 优 解 . 如 果 选 择 方向 为 
“下 、 下 、 下 、 下 ”的 路 径 , 模 10 以 后 的 路 径 长 度 为 (5 十 5 十 5 十 5)modl10 一 0. 
动态 规划 算法 不 适 于 这 样 的 问题 ,原因 在 于 这 个 问题 不 满足 优化 原则 . 方向 为 "下 、 下 
下 、 下 ”的 路 径 是 一 条 从 S 到 工 的 最 优 路 径 , 但 是 它 的 某 些 子路 径 , 比 如 从 C 向 下 到 了 的 路 
径 并 不 是 从 C 到 T 的 最 优 路 径 . 
这 说 明 在 使 用 动态 规划 设计 技术 之 前 ,首先 要 搞 清楚 所 求解 的 问题 是 不 是 满足 优化 原 
则 . 这 是 使 用 动态 规划 技术 的 必要 条 件 . 


3.2 动态 规划 算法 的 设计 要 素 


这 里 用 一 个 矩阵 链 的 乘法 问题 为 例 来 说 明 动态 规划 算法 的 设计 要 素 . 

例 3.3 设 Al， As,…,A, 为 n 个 和 矩阵 的 序列 ,其 中 A; 为 P;-1 XP; 阶 矩 阵 ,z 一 1， 
2,…,n. 这 个 矩阵 链 的 输入 用 向 量 P= 二 二 Po， Pi,….P, 记 给 出 ,其 中 P。 是 矩阵 Ai 的 行 数 ， 
Pi(i 一 1,2,…,n 一 1) 既 是 和 矩阵 A; 的 列 数 也 是 矩阵 Ai: 的 行 数 ,最 后 的 P, 是 矩阵 A, 的 列 
数 . 计算 这 个 矩阵 链 需要 做 "一 1 次 两 个 矩阵 的 相 乘 运算 ,可 以 用 "一 1 对 括号 表示 运算 的 顺 
序 . 因为 矩阵 乘法 满足 结合 律 .无 论 采 用 哪 种 顺序 .最 后 的 结果 都 是 一 样 的 . 但 是 ,采用 不 同 
的 顺序 计算 的 工作 量 却 不 一 样 . 怎样 定义 两 个 矩阵 相 乘 的 工作 量 呢 ? 假设 矩阵 A; 与 A, 相 
乘 ,其 中 Ai 是 i 行 ; 列 的 矩阵 ,As 是 7 行 上 列 的 矩阵 ,那么 它们 的 乘积 A1A; 是 ;i 行 上 A 列 矩 
阵 , 含 有 大 个 元 素 . 以 元 素 相 乘 作为 基本 运算 ,乘积 中 每 个 元 素 的 计算 都 需要 做 j 次 乘法 ， 
于 是 计算 A1As 总 共 需 要 jk 次 乘法 .请 看 下 面 的 具体 实例 : 
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假设 输入 的 是 P= 二 10,100,.5,50 二 ,这 说 明 有 3 个 矩阵 相 乘 ,其 中 
0 
有 两 种 乘法 次 序 , 即 (Ai1A;)A3 和 Ai(AsA;). 如 果 采 用 第 一 种 次 序 ,执行 的 基本 运算 次 
数 是 : 
10Xx 100X5+ 10X5x50= 7500 
而 采用 第 二 种 次 序 ,执行 的 基本 运算 次 数 是 : 
10X100X50 十 100X5X50 一 75000 

工作 量 相差 达到 10 We 

我 们 的 问题 是 : 给 定向 量 已 ,确定 一 种 乘法 次 序 ,使 得 基本 运算 的 总 次 数 达到 最 少 . 

ce 针对 每 种 次 序 计算 基本 运算 的 次 数 ,从 
中 找 出 具有 最 小 运算 次 数 的 乘法 次 序 . 每 一 种 乘法 次 序 对 应 了 一 种 在 个 项 中 加 一 1 对 括 
号 的 方法 . 根据 组 合 数学 的 知识 不 难 知道 ,加 n 对 括号 的 方法 数 是 一 个 Catalan 数 , 它 的 值 


本 十 记 
入 使 用 蛮 力 算法 的 时 间 将 是 : 


2 
是 - ( .| 根据 Stirling 公式 ,即使 对 每 种 次 序 的 计算 工作 量 为 常数 ,对 规模 为 十 1 的 办 
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nn 二] enimnin 
这 是 一 个 指数 时 间 的 算法 , 下面 尝 试 动态 规划 的 算法 . 我们 将 从 子 问题 的 划分 、 递 推广 
程 的 确定 .递归 和 迭代 的 实现 方法 .复杂 度 分 析 等 方面 介绍 动态 规划 算法 的 设计 特征 . 


3.2.1 子 问题 的 划分 和 北 推 方程 


我 们 的 优化 目标 是 基本 运算 次 数 的 最 小 化 . 如 何 界定 子 问题 的 边界 ? 令 Al., 表 示 输 入 
的 矩阵 链 , 如 果 从 前 向 后 划分 ,所 产生 的 子 问题 只 有 后 边界 ,是 A1.; 的 形式 ,i 二 1,2,…,n. 但 
ee Aij，j 六 i 时 ,我 们 不 仅 需 要 子 问 题 A 的 信息 ,也 需要 子 问 题 Aci+w.; 的 信 

息 . 这 说 明子 问题 的 划分 需要 前 后 两 个 边界 .用 A;.; 定 义 和 矩阵 链 A;A ir1…A; 相 乘 的 子 问 题 ， 
mi 站 j 表 示 得 到 乘积 A;.; 所 用 的 最 少 基 本 运算 次 数 . 假定 其 最 后 一 次 相 乘 发 生 在 和 矩阵 链 

As 和 Au 之 间 , 即 
AAAi 一 (AAAD)CAHAH…Ai) 二 

那么 子 问题 A;.; 的 计算 依赖 于 子 问 题 A; 和 Ari.j 的 计算 结果 . 换 句 话说 ,m[i,j] 的 值 依赖 
于 m[i,kj 和 m[k 十 1,7] 的 值 ,具体 的 依赖 关系 可 以 表示 为 


Wn) 2[ 


0 = 
m[Li,j] = min{m[isk]+m[kt+ 1 + Pe PP;} i<ji 
上 式 中 的 & 代 表 子 问题 的 划分 位 置 .应 该 考虑 所 有 可 能 的 划分 , 即 ik=j, 从 中 比较 出 最 小 


的 值 ;P-:;PeP; 是 最 后 把 两 个 子 和 矩阵 链 Ai. 和 Arri.; 的 结果 和 矩阵 相 乘 所 需要 的 基本 运算 次 
数 . 当 ;一 ) 时 ,矩阵 链 只 有 一 个 矩阵 A; ,这 时 乘法 次 数 是 0, 对 应 了 递 推 式 的 初 值 . 
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不 难看 到 这 个 问题 是 满足 优化 原则 的 . 这 意味 着 当 m[i,j] 达 到 最 小 值 时 , 子 问题 的 优 
化 函数 值 mw[i,kj] 和 m[k 十 1, 门 也 是 最 小 的 . 因为 如 果 对 于 子 问题 存在 更 好 的 优化 函数 值 ， 
比如 说 存在 更 小 的 mx[i,k] ,那么 用 这 个 更 小 的 值 蔡 换 原 来 的 mx[i,k], 就 可 以 得 到 更 小 的 
m [i, 门 ,这 将 与 m[i, 门 的 最 优 性 矛盾 . 


3.2.2 动态 规划 算法 的 遂 归 实现 

下 面 考 虑 算法 的 实现 . 为 了 确定 每 一 次 相 乘 时 加 括号 的 位 置 ,需要 设计 表 s[i,j 来 记录 
m[i, 站 达到 最 小 值 时 & 的 划分 位 置 . 根据 上 面 的 递 推 公式 ,可 以 有 两 种 实现 方法 : 递归 实现 
和 和 办 代 实现 . 

先 考 虑 递归 实现 方法 . 

算法 3.1 RecurMatrixChain(P,i,) 


输入 : 矩阵 链 Ai,j 的 输入 为 向 量 P= 二 Pii ,Pi,…,Pj, 其 中 1<i<j<n 
输出 : 计算 Ai, 的 所 需 最 小 乘法 运算 次 数 m[i， 站 和 和 最 后 次 运算 的 位 置 s[i, 站 
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1. if i=j 

2. then m [i,7]<—0; s[i,j]<i; return m[i,j] 

3.m[i, 门 二 co 

&. 8, 门 < 

5 for sr to j 一 1 do // 考 虑 所 有 可 能 的 划分 位 置 

6 dg< RecurMatrixChain(P,,A) 十 RecurMatrixChain( 了 ,十 1.7) 十 Pi-:PeP， 

7 fg<m[i,j] 

8 then m[i,j]<-g // 用 找到 的 更 好 优化 函数 值 替 换 原 值 ,并 记录 划分 位 置 
9 s[isj]=k 


10. return m[i,j] 


允 个 矩阵 相 乘 ,只 需 令 ;一 1 一 2, 调用 算法 3. 1 即 可 . 下面 分 析 这 个 递归 算法 的 效率 . 
考虑 输入 规模 为 n 的 矩阵 能 相 乘 , 即 i 二 1,j 二 n 的 情况 .算法 在 行 5 执行 for 循环 ,k 从 1 到 
n 一 1. 每 次 进入 循环 体 都 在 行 6 进行 两 个 子 问题 的 递归 求解 ,其 中 一 个 规模 为 k, 男 一 个 为 
n 一 k. 其 余 工作 都 是 常数 时 间 . 因此 该 算法 的 时 间 复 杂 度 函数 满足 递 推 关系 : 

0 n=1 


TD = 
STO) FT A+OD) n>1 
k=]1 
经 过 化 简 得 : 

nl nl nl 
TO) 0 + THA) 十 >)TO 一) = O(n)+22) Th) 


k=1 ET k=1 
定理 3.1 当 n>1 时 ,T(n) 一 Q(2"!1). 
证 n==2,T(2) 之 c=c12-1 ,ci 二 c/2 为 某 个 正 数 . 
假设 对 于 任何 小 于 n 大 于 等 于 2 的 &,T(k) 宇 c2*-!, 则 存在 某 个 常数 c ,使 得 


TOn) >en +25T0) > e+2am 


二 cn 二 a(2"—4) 宇 2"! 
可 以 看 到 ,通过 使 用 了 动态 规划 的 设计 思想 ,该 算法 的 时 间 复 杂 度 比 蛮 力 算法 有 所 改 
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进 ,但 是 并 没有 得 到 多 项 式 时 间 的 高 效 算法 . 时间 复 杂 度 高 的 原因 在 于 : 在 递归 调用 中 同一 


4.4 


个 子 问 题 被 多 次 重复 计算 . 以 矩阵 链 Ai.s 的 计算 
为 例 . 图 3.4 用 一 棵 横 放 的 树 给 出 了 递归 计算 的 


过 程 . 每 个 问题 对 应 一 个 结 点 , 树 根 是 原始 问题 ， 
记 作 “1..5”. 第 1 层 的 结 点 对 应 于 原 问 题 在 
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图 3.4 子 问题 


k 二 1,2,3,4 的 不 同位 置 进行 划分 所 得 到 的 8 个 
子 问题 ,每 个 子 问题 表示 成 原 问题 的 儿子 .第 2 层 
对 应 这 8 个 子 问题 进一步 递归 求解 得 到 的 新 的 子 
问题 ,有 24 个 .类 似 地 ,第 3 层 有 32 个 新 的 子 问 
题 ,第 4 层 有 16 个 新 的 子 问题 . 在 整个 递归 计算 
中 总 计 产 生 了 

1 十 8 十 24 十 32 十 16 二 81 
个 子 问题 . 但 是 ,根据 边界 考查 不 同 的 子 问 题 个 
数 : 规模 为 1 的 子 问题 有 5 个 ,规模 为 2 的 有 
4 个 ,规模 为 3 的 有 3 个 ,规模 为 4 的 有 2 个 , 规 
模 为 5 的 有 1 个 ,总 计 

5 十 4 十 3 十 2 十 1 = 15 

个 不 同 的 子 问题 . 这 说 明 算法 计算 的 81 个 子 问 题 
中 有 许多 是 重复 的 ,这 就 是 递归 实现 动态 规划 算 
法 时 间 复 杂 度 高 的 原因 . 


3.2.3 动态 规划 算法 的 迭代 实现 


如 果 在 计算 中 对 每 个 子 问 题 只 计算 一 次 ,并 
且 把 结果 保存 起 来 . 等 到 后 面 计 算 其 他 子 问题 需 
要 这 个 值 时 ,直接 把 它 代 入 ,这样 就 能 够 改善 算法 
的 时 间 复 杂 度 . 这 就 是 迭代 实现 动态 规划 算法 的 
思想 .为 了 实现 这 个 想法 ,需要 解决 以 下 两 个 
问题 : 

(1) 开辟 一 个 存储 空间 ,用 表格 的 方式 来 存 
储 子 问题 的 优化 函数 值 和 划分 边界 ,通常 把 这 些 
表格 叫做 “备忘录 ”. 这 说 明 提 高 效率 需要 付出 空 
间 的 代价 . 对 于 规模 大 的 实例 ,过 大 的 空间 需求 往 


往 成 为 不 能 使 用 动态 规划 算法 的 主要 因素 . 


(2) 子 问题 的 计算 需要 从 底 向 上 进行 . 每 个 子 问题 只 计算 一 次 . 这 就 是 说 ,从 最 小 规模 
的 子 问题 开始 ,比如 规模 为 1 的 所 有 子 问题 ,然后 是 规模 为 2 的 所 有 子 问题 ,接着 是 规模 为 
3 的 所 有 子 问 题 …… 直到 规模 为 n 的 子 问 题 (原始 问题 ) 为 止 . 这 样 才能 在 前 面 的 计算 中 准 
备 好 后 面 计算 要 查找 的 数据 . 
下 面 的 伪 码 给 出 了 和 矩阵 链 问题 动态 规划 算法 的 迭代 实现 方法 . 
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算法 3.2 MatrixChain(P,n) 

输入 : 矩阵 链 Al.., 的 输入 为 向 量 P 二 二 Po ,Pi ,…,P, 一 

输出 : 计算 A;,j 的 所 需 最 小 乘法 运算 次 数 m[i, 门 和 最 后 一 次 运算 的 位 置 s[i,j] ,1<i<j<n 
1. 令 所 有 的 m[i, 疏 初 值 为 0,s[i, 门 初 值 为 i,1<i<j<<n 


2. for ro2 to n do //r 为 当前 计算 的 链 长 ( 子 问 题 规模 ) 
号 risl 而 nl 二 //n 一 r 十 1 为 最 后 一 个 r 链 的 前 边界 
4. ji 十 r 一 1 // 计 算 前 边界 为 i, 长 为 + 链 的 后 边界 j 
5. m[i,j]<—m[it+1,j]+P;-1 * P; * P; // 划 分 为 Ai(Ai+l…Ai),* 为 普通 乘法 
6. s[i,7]<i // 记 录 分 割 位置 

并 for k<itl to j—l1 do 

8. t<-m[isk] 十 m[k 十 1, 门 十 Pi * Pi * P; ， // 划 分 位 置 是 (Ai…Ak)CA Ai) 

9. 计 zi<m[i,] // 用 更 好 的 值 蔡 换 

10. then m[i,j]<t 

1; si 门人 


下 面 分 析 这 个 算法 的 时 间 复 杂 度 . 在 算法 的 行 2, 行 3 和 行 7 的 规模 都 不 超过 O(n) ,总 
计 艇 套 循环 执行 OC) 次 ,循环 体内 的 计算 为 2 次 加 法 ,2 次 乘法 ,是 常数 时 间 , 因 此 算法 的 
时 间 复 杂 度 是 斑 C2) 王 O02) , 比 起 递归 实现 的 指数 时 间 确 实 有 了 明显 的 改进 ， 


3.2.4 一 个 简单 实例 的 计算 过 程 


下 面 给 出 一 个 计算 实例 ,进一步 说 明 备忘录 的 结构 . 
设 输 入 是 P= 二 30,35,15,5,10,20 二 ,一 5, 相 应 的 矩阵 链 是 : Ai ,As ,A;,A, ,As ,其 中 
Ai: 30 X35, A2: 35X15, As: 15X5, A,: 5X10, As: 10x20 
计算 开始 , 当 子 问题 规模 r=1 时 ,所 有 的 m[1,1],m[2,2j],…,m[5,5j] 都 等 于 0. 然后 
r 二 2, 有 4 个 子 问题 ,计算 结果 是 : 
m[1,2] = 30 Xx 35 X15 = 15 750 
m[2,3] = 35 Xx 15 Xx 5 = 2625 
mL3;4] = 15X 5 X10=750 
m[4,5] = 5X 10X20 1000 
接着 ,r= 二 3, 有 3 个 子 问题 ,计算 结果 是 : 
m[1;3] = min{m[1;2]++30X15X5; mL2,3]++30X35X5}=7875, s[1,3] =1 
m[2,4] = min{m[2,3] 十 35X 5X10, m[3,4] 二 35X15X10} = 4375,， s[2,4] =3 
m[3,5] = min{m[3,4] 二 15X 10Xx20, mL4,5] 十 15X5X20} 一 2500，s[3,5] 一 3 
接着 ,一 4, 有 2 个 子 问题 ,计算 结果 是 : 
m[1,4] = min{m[2,4] 十 30 X35X10,m[1,2] 十 mm[3,4] 十 30 X15 X10， 
m[1,3] 十 30 XxX5Xx10} = 9375 
m[2,5] = min{m[3,5] 十 35 X15X20,m[2,3] 十 mm[4,5] 十 35 X5 X20， 
m[L2,4] 十 35 X10 x 20} = 7125 
对 应 的 划分 位 置 分 别 是 [1,4]=3 和 xs[2,5]=3. 最 后 :~ 一 5: 就 是 原始 问题 ,计算 结果 是 : 
m[1,5] = min{m[2,5] 十 30 X35X20,m[l1,2] 十 m[3,5] 十 30 X15 x 20, 
m[1,3] 十 m[4,5] 十 30 X5X20,m[l1,4] 十 30 X10 X20} = 11 875 


| 


#15] = 3 
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存储 上 述 计 算 结 果 的 备忘录 结构 如 表 3. 1 和 表 3. 2 所 示 . 
表 3.1 优化 函数 值 的 备忘录 


7 一 1 m[1,1] 一 0 m[2,2]=0 m[3.3]=0 m[4,4]=0 m[5,5]=0 


7 一 2 m[1,2]=15750 | m[2,3]=2625 | m[3,4]=750 m[4,5]=1000 


r=3 | m[1,3]=7875 m[2,4]=4375 | m[3,5]=2500 


r=4 m[1,4]=9375 m[2,5]=7125 


r=5 |m[1,5]=11 875 


表 3.2 标记 函数 
r=2 s[1,2]=1 s[2,3]=2 s[3,4]=3 s[4,5]=4 
r=3 s[1,3]=1 s[2,4]=3 s[3,5]=3 
r=4 s[1,4]=3 s[2,5]=3 
r=5 s[1,5]=3 


根据 备忘录 可 以 知道 最 少 运算 次 数 是 11 875 ,根据 s[1,5]==3 知道 最 后 一 次 划分 在 第 
三 个 矩阵 的 后 面 ,于 是 得 到 Ai..s 二 Ai..3As.s. 接着 查找 s[1,3]==1, 于 是 得 到 Ai..s 二 AiiAz.s， 
从 而 得 到 最 佳 的 运算 次 序 是 : 

AiAsAsAsAs = (Ai1(AsA)) A As) 

通过 矩阵 链 相 乘 的 例子 ,我 们 可 以 总 结 动态 规划 算法 的 设计 要 素 ， 

(1) 划分 子 问题 ,用 参数 表达 子 问题 的 边界 ,将 问题 求解 转变 成 多 步 判断 的 过 程 . 

(2) 确定 优化 函数 ,以 该 函数 的 极 大 (或 极 小 ) 作 为 判断 的 依据 ,确定 是 否 满足 优化 
原则 . 

(3) 列 出 关于 优化 函数 的 递 推 方程 (或 不 等 式 ) 和 边界 条 件 . 

(4) 考虑 是 否 需 要 设立 标记 函数 ,以 记录 划分 位 置 . 

(5) 自 底 向 上 计算 ,以 备忘录 方法 (表格 ) 存 储 中 间 结 果 . 

(6) 根据 备忘录 (和 标记 函数 ) 通 过 追溯 给 出 最 优 解 . 


3.3 动态 规划 算法 的 典型 应 用 
本 节 将 介绍 动态 规划 算法 的 一 些 典 型 应 用 . 


3.3.1 投资 问题 


例 3.4 设 有 m 元 钱 ,n 项 投资 ,函数 f(x) 表示 将 xz 元 投入 第 i 项 项 目 所 产生 的 效益 ， 
i 二 1,2,… wn. 问 ; 如 何 分 配 这 m 元 钱 ,使 得 投资 的 总 效益 最 高 ? 

假设 钱 数 的 分 配 都 是 非 负 整 数 ,分 配给 第 i 个 项 目的 钱 数 是 x;, 那 么 该 问题 可 以 描 
述 为 : 


目标 函数 max{ 有 i(zi) 十 fz(zz) 十 … 十 f(x,)} 
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约束 和 条件 却 十 zz 十 … 十 x = 二 nn， X11 EN 
一 个 简单 的 实例 是 : 有 5 万 元 钱 ,4 个 项 目 ,效益 函数 (以 万 元 为 单位 ) 如 表 3. 3 所 示 . 
表 3.3 效益 函数 
注 fi1(zx) flr) f(x) 3 fi(r) flr) fs(r) Rl) 
0 0 0 0 0 3 45 10 30 22 
11 0 区 20 4 14 15 32 好 
2 12 5 10 21 5 15 20 40 24 


使 用 动态 规划 算法 首先 需要 界定 子 问题 的 边界 . 可 以 是 按 项 目 划 分 成 个 阶段 ,比如 先 
考虑 对 第 1 个 项 目的 分 配 ,接着 考虑 对 前 2 个 项 目的 分 配 ，…… ,顺序 做 下 去 ,直到 考虑 对 
允 个 项 目的 分 配 .每 阶段 的 问题 都 构成 后 面 阶段 的 子 问题 . 与 前 面 的 最 短路 径 和 和 抢 阵 链 乘法 
的 不 同 点 在 于 : 这 里 每 个 阶段 的 子 问题 还 存在 另 一 个 参数 : 投资 的 钱 数 . 于 是 每 个 阶段 的 
子 问题 还 可 以 按照 钱 数 进 行 更 细 的 划分 . 这 里 使 用 的 是 具有 两 个 不 同 参数 的 优化 函数 . 设 
Fe(z) 表 示 > 万 元 钱 投 给 前 A 个 项 目的 最 大 效益 ,其 中 上 = 二 1,2,…,n,x 二 1,2,…,m. 在 第 
&A 步 , 钱 数 为 zx 时 需要 做 的 是 : 假设 知道 p 元 钱 (p 三 zx) 投 给 前 & 一 1 个 项 目的 最 大 效益 ,如 
何 对 前 & 个 项 目 分 配 x 元 钱 以 取得 最 大 的 效益 .首先 从 x 万 元 中 分 配 x,(0 二 x 三 x) 万 元 给 
第 kk 个 项 目 .那么 剩 下 的 x 一 x 万 元 钱 将 分 配给 前 A 一 1 个 项 目 . 最 佳 分 配方 案 已 经 在 第 k 一 1 
步 计 算 过 . 于 是 我 们 得 到 如 下 的 递 推 方程 和 边界 条 件 : 

Fi.(zx) = ee F(z— 2)}, k= 2,3%° ,Nn 


Fi(z) = fi(z); Fi(0) =0; k= 1;23%%n 
这 里 需要 设立 标记 函数 x(x), 它 表示 当 F(x) 取得 最 大 值 时 应 该 分 配给 第 上 个 项 目 
的 钱 数 . 
不 难 验 证 这 个 问题 满足 优化 原则 . 算法 的 伪 码 描述 请 读者 自己 给 出 .下面 以 上 述 实例 看 
看 算法 的 运行 过 程 . 
首先 ,计算 Fi(z).z 万 元 钱 仅 分 配给 第 一 个 项 目 , 这 对 应 于 递 推 关 系 的 初 值 ,可 以 直接 
从 效益 函数 表 中 查 到 ,于 是 有 
ih A ee 
ma = J = iD = N= I ml) = w= ld 
这 些 值 存在 备忘录 的 第 一 列 . 见 表 3. 4. 下 面 计算 F: (z). 首先 计算 F,(1) ,总 钱 数 1 万 元 钱 ， 
分 配给 第 二 个 项 目 可 能 有 两 种 结果 : 0 万 元 或 1 万 元 . 于 是 递 推 关 系 是 : 
Fs(1) = max{fsa(0)+Fi(1), f2(l)+Fi(0)) 一 max(0 十 11.0 十 0} = 11， 
wt1l) 一 站 
其 中 zz (1) 王 0 表示 取得 最 大 效益 11 万 元 时 分 配给 第 二 个 项 目的 钱 数 是 0. 类 似 地 可 以 计 
算 Fz(2)、F:(3)、 Fe(4) 和 Fe(5): 
F2(2) = max{f2(0) + Fi(2), fe (1)+F(),f(2)+F(0)}=12,. ze(2) 一 0 
Fs(3) = max{ f2(0) + Fi(3),f2(1)+ Fi(2),f.(2) + Fi(1)., 
f2(3)+F(0)} 一 16， zs(3)=2 


Ey 


圳 避 避 
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Fs(4) = max{ 户 (0) + Fi(4) ,fs (1) + Fi (3),f(2) + Fi(2) ,fs(3) + Fi (1), 
fe(d)+F(0))}=21, xz(4) 一 3 
Fs(5) = max{f2(0) + Fi(5), fe (1) + Fi (4) , 户 (2) 十 已 (3) ,万 (3) 十 局 (2)， 
fe(d) t+).fs(5)+F(0)}) =26, zs(5)=4 
这 些 值 和 相应 的 标记 函数 zs (z) 存 在 备忘录 的 第 2 列 . 照 此 下 去 ,继续 计算 Fs (z) 和 
F(x) ,Xx 二 1,2,3,4,5. 从 而 完成 整个 备忘录 . 从 表 中 F (5) 一 61 可 以 知道 投资 5 万 元 可 以 
产生 的 最 大 效益 是 61 万 元 .那么 能 够 达到 这 个 效益 的 分 配方 案 是 什么 呢 ? 这 需要 从 表 上 的 
标记 函数 从 后 向 前 追溯 . 首先 查 到 zx:(5) 王 1 知道 1 万 元 分 配给 第 4 个 项 目 . 于 是 分 配给 前 
三 个 项 目的 钱 数 为 5 一 1 一 4 万 元 . 再 查 zs (4) 王 3, 从 而 知道 在 4 万 元 中 又 有 3 万 元 分 配给 
第 三 个 项 目 . 那 么 还 剩 下 4 一 3 一 1 万 元 分 配给 前 两 个 项 目 . 最 后 查 zs (1) 一 0, 说 明 在 这 1 万 
元 中 分 配给 第 二 个 项 目的 钱 数 是 0, 只 能 全 部 分 配给 第 一 个 项 目 . 经 过 这 样 的 追溯 ,可 以 得 
到 问题 的 解 , 即 


分 配方 案 是 5 而 王权 大 三 2 一 27 二] 
最 大 效益 是 : F,(5) = 61 
对 于 解 的 追溯 过 程 可 以 在 表 3. 4 的 灰色 方 格 中 看 到 . 


| 


表 3.4 解 的 追溯 

I Fi(x) wi F(x) ZX2 (x) Fs(x) Xa3(7) F(x) XAT) 

1 11 全 11 0 11 0 20 1 

2 12 2 12 0 13 1 31 1 

3 18 3 16 2 30 3 33 1 

4 14 4 21 3 41 3 50 L 

5 15 5 26 4 43 4 61 TL 

最 后 ,让 我 们 看 看 这 个 算法 的 效率 . 假设 给 定 的 输入 实例 含有 个 项 目 , 钱 数 为 m, 那 么 

备忘录 中 有 mm 行 n 列 , 共计 mn 项 .根据 递 推 关 系 


Ftr) = mx {Ain File — nd} 
0<x < 


Fi(7x) = fi(zx) 
除了 k=1 的 初 值 以 外 ,对 项 F(x) (2 过 kn.1 志 x 三 m) 的 计算 需要 xz 十 1 次 加 法 和 之 次 比 
较 .对 上 求 和 ,于 是 算法 执行 的 加 法 次 数 满足 : 


Di ded Do= dn — Wm 
L=2 z=1 2 


比较 次 数 满 足 : 
> > 并 一 去 0 一 Dm(m+t 1) 
于 是 该 算法 的 时 间 复 杂 度 是 Wln,m) 二 OG?). 


动态 规划 


3.3.2 背包 问题 


背包 问题 (Knapsack Problem) 是 一 个 著名 的 NP 难 问题 . 

例 3.5 一 个 旅行 者 准备 随身 携带 一 个 背包 . 可 以 放 入 背包 的 物品 及 种 .物品 j 的 重 
量 和 价值 分 别 为 zw ,v;;,j 二 1,2,…,n. 如 果 背 包 的 最 大 重量 限制 是 5， 怎样 选择 放 和 人 背包 的 
物品 以 使 得 背包 的 价值 最 大 ? 

这 是 一 个 组 合 优化 问题 , 设 zx; 表示 装 入 背包 的 第 j 种 物品 的 数量 ,那么 目标 函数 和 约 
东 条 件 是 : 


目标 函数 max 》) vx; 
j=1 


pa ee 
We | 
mEN 

如 果 组 合 优化 问题 的 目标 函数 和 约束 条 件 都 是 线性 函数 , 称 为 线性 规划 问题 ,如 果 线 性 
规划 问题 的 变量 zx; 都 是 非 负 整数 , 则 称 为 整数 规划 问题 . 背包 问题 就 是 整数 规划 问题 . 限制 
所 有 的 zj 二 0 或 1 时 的 背包 问题 称 为 0-1 背包 问题 . 

不 难 验 证 背包 问题 也 满足 优化 原则 ,可 以 使 用 动态 规划 设计 技术 . 与 投资 问题 类 似 , 背 
包 问 题 也 有 两 个 参数 ,物品 种 类 和 背包 重量 的 限制 .可 以 根据 物品 种 类 和 背包 的 重量 限制 进 
行 子 问题 划分 . 设 Fi(y) 表 示 只 允许 装 前 & 种 物品 ,背包 总 重 不 超过 > 时 背包 的 最 大 价值 ， 
分 两 种 情况 考虑 : 不 装 第 & 种 物品 或 者 至 少 装 1 件 第 上 种 物品 . 如 果 不 装 第 & 种 物品 ,那么 
只 能 用 前 & 一 1 种 物品 装 入 背包 ,而 背包 的 重量 限制 仍旧 是 ,在 这 种 情况 下 ,背包 最 大 价值 
是 Fi-:Cy). 如 果 第 & 种 物品 装 了 一 件 ,那么 背包 的 价值 是 w , 且 重 量 是 zw , 剩 下 的 物品 仍 
旧 需 要 在 前 种 物品 中 选择 (因为 最 优 的 装 法 可 能 包含 多 个 第 上 种 物品 ). 于 是 问题 归 约 为 在 
背包 重量 限制 为 y 一 ww 的 情况 下 如 何 用 前 & 种 物品 装 入 背包 以 取得 最 大 价值 Fi(y 一 wi). 
我 们 需要 从 这 两 种 情况 中 取 价 值 较 大 的 作为 最 优选 择 . 于 是 得 到 递 推 关系 与 边界 条 件 如 下 : 

Fi(y) = max{Fi(y) Fi(y OO— wi) vo,} 


Fo(y)=0 0<y<b 

Fi(0)=0 0<k<n 
y 

Fi(y) 二 | 寺 | 

Fi(y)=—% y<=0 


上 面 公式 的 初 值 比 较 多 ,Fo。(y) 是 背包 不 装 物 品 的 价值 ,显然 等 于 0;Fi(0) 是 背包 重量 限制 
为 0 时 的 最 大 价值 ,当然 也 等 于 0;Fi(y) 是 只 能 用 第 一 种 物品 背包 重量 限制 为 y 时 的 最 大 
价值 ,为 了 保证 背包 不 超重 ,第 一 种 物品 至 多 能 装 Ly/w | 个 ,因此 背包 价值 是 Ly/w ju . 为 什 
么 还 需要 设 定 当 y<0 时 的 初 值 呢 ? 因为 在 递 推 式 中 有 Fi(y 一 wr) ,在 递 推 过 程 中 , 某 些 
y 一 ws 可 能 得 到 负 值 ,这 意味 着 背包 此 刻 能 够 承受 的 重量 已 经 小 于 第 种 物品 的 重量 ,实际 
上 是 不 能 装 的 . 通过 令 Fi(y) 二 一 oo( 可 以 选 机 器 中 的 最 小 数 ) ,使 得 这 个 值 在 与 男 一 个 优化 
函数 值 比较 时 被 淘汰 ,从 而 使 得 这 种 装 法 被 排除 . 

与 投资 问题 相 比较 ,背包 问题 的 递 推 关 系 也 可 以 使 用 与 投资 问题 类 似 的 表述 ,请 读者 给 
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出 相关 的 表达 式 和 初 值 . 
考虑 下 面 的 实例 ,其 中 
DU 1， wv 3， vs Gs wh 9 
Tw 2 Ts 3， ws 4 twa 7 
b= 10 


则 Fi(y) 的 计算 表 如 表 3. 5 所 示 , 其 中 省 略 了 所 有 F (0) 的 值 . 
表 3.5 优化 函数 Fi(y) 


外 1 2 3 4 5 6 多 8 a 10 
1 0 1 1 2 2 3 3 4 4 5 
2 0 于 3 3 4 6 6 7 3 和 
3 0 1 3 5 5 6 8 10 10 11 
4 0 1 3 5 5 6 a 10 10 12 


表 3.5 只 是 计算 了 各 个 子 问题 的 优化 函数 值 ,最 后 一 项 F,(10) 二 12, 这 就 是 背包 的 最 大 价 
值 . 怎样 选择 物品 可 以 得 到 这 个 价值 呢 ? 可 以 像 投资 问题 一 样 设立 标记 函数 ,记录 得 到 这 个 值 
时 所 装 入 的 最 大 标号 物品 的 个 数 . 这 里 采用 另 一 种 标记 方法 . 令 i.(y) 表 示 在 计算 优化 函数 值 
Fi(y) 时 所 用 到 物品 的 最 大 标号 . 在 计算 Fi(y) 时 ,如 果 已 -CCy) 比 已 (>y 一 zw) 十 人 大 ,那么 此 
刻 装 入 背包 物品 的 最 大 标号 与 计算 Fi-1(y) 所 用 物品 的 最 大 标号 一 致 ;反之 ,选择 标号 为 的 
物品 装 和 背包 才能 使 得 背包 价值 达到 最 大 , 即 i,(y) = 二 k. 于 是 ii(y) 满 足下 述 递 推 关 系 : 
iei(y) Fi(y) > Fi(y— wi) + 
yy = 
i Fi(y) Fi(y—w) to 
不 难看 出 标记 函数 i(y) 不 需要 额外 的 计算 ,只 需 计算 Fi(y) 时 把 相关 的 i(y) 值 填 入 一 个 
标记 表 就 行 了 . 标记 表 的 格式 如 表 3. 6 所 示 ,其 中 省 略 了 所 有 i(0)==0 的 初 值 . 


表 3.6 标记 函数 去 (y) 


2 0 1 2 2 2 2 2 2 2 2 
3 0 1 2 3 3 3 3 3 3 3 
4 0 1 2 3 3 3 4 3 1 4 


根据 表 3. 6 可 以 向 前 追踪 ,找到 问题 的 解 . 具体 追踪 过 程 如 下 : 由 i(10) 二 4 可 知 4 号 
物品 至 少 用 1 个 ,占用 背包 重量 ws 二 7 ,背包 剩余 重量 是 10 一 7 一 3, 于 是 继续 检查 i,(3). 由 
于 za(3) 一 2， 即 剩余 物品 的 最 大 标号 是 2, 这 说 明 2 号 物品 至 少 装 1 个 ,而 不 再 装 人 第 
2 个 4 号 物品 和 3 号 物品 . 装 和 这 个 2 号 物品 后 ,背包 重量 又 增加 了 zw 一 3, 剩 余 背 包 重量 是 
0, 于 是 不 能 装 任何 物品 了 . 用 公式 表示 追踪 解 的 过 程 是 : 
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三 da 2 
ia(10 一 zw) 一 2(3) 一 2 之 二 lz 一 1zs 一 0 
3 wd = (00) = Wz = a =O 
最 终 得 到 该 实例 的 解 是 : zi 二 0,zxs 二 1,zxs 二 0,z4 二 1. 上 述 追 踪 过 程 也 可 以 用 伪 码 描述 . 
算法 3.3 TrackSolution 
输入 ; i(y) 表 ,其 中 有 =1,2,…,n,y 二 1,2,…,b 
输出 : rm ,zz，… ,zon 种 物品 的 装 入 量 


1. for jltom do 


zi-0 
.yb jn 
ji(y) 


,ie 


2 
3 
4 
5 
6. yy Ww 
7. while (y= do 
8 EV 
9 me 

10. if i(y)A0 then goto 4 

最 后 考虑 算法 的 时 间 复 杂 度 . 与 投资 问题 类 似 ,该 算法 的 时 间 复 杂 度 为 O(n6). 表面 上 
看 起 来 这 是 一 个 n 和》 为 变量 的 多 项 式 , 但 这 个 算法 并 不 是 多 项 式 时 间 的 算法 . 因为 正 整数 
b 的 输入 规模 是 5 在 机 器 中 占用 的 存储 空间 大 小 ,因此 问题 的 输入 规模 实际 上 是 nn 和 logb 
(logb 是 4b 的 二 进 制 表示 的 位 数 ). 显然 O(nb) 不 是 nn 和 1ogb 的 多 项 式 函 数 ,我 们 把 这 样 的 算 
法 称 为 伪 多 项 式 时 间 的 算法 .关于 这 个 问题 将 在 9. 3 节 做 进一步 的 讨论 . 

背包 问题 具有 广泛 的 应 用 背景 .许多 任务 调度 、 资 源 分 配 、 轮 船 装载 等 问题 都 可 以 用 背 
包 问 题 建 模 . 背包 问题 也 有 许多 变种 ,比如 在 原 有 背包 问题 的 基础 上 增加 体积 约 东 条 件 , 即 
物品 i 不 但 有 重量 wi 价值 w, 还 有 体积 di;, 背包 本 身 也 有 体积 DD 的 限制 . 作为 典型 的 
NP 难 问题 ,许多 人 对 背包 问题 进行 了 深入 的 研究 ,特别 对 0-1 背包 问题 已 经 得 到 了 有 效 的 
近似 算法 . 这 些 将 在 第 10 章 给 予 介 绍 . 


3.3.3 最 长 公共 子 序 列 LCS 


在 实际 问题 中 经 常 需要 对 两 个 对 象 进行 类 比分 析 , 找 出 它们 之 间 的 公共 部 分 . 最 长 公共 
子 序列 问题 就 是 这 类 问题 的 一 种 简单 的 抽象 模型 . 
定义 3.1 设 X 和 2Z 是 两 个 序列 ,其 中 
XK =< rir zn > 
Z=< zr > 
如 果 存 在 X 的 元 素 构成 的 按 下 标 严格 递增 序列 二 zx ,za ,… ,zi 二 使 得 x 二 zz， j 二 1， 
2,…,k, 那 么 称 Z 是 X 的 子 序列 .Z 含有 的 元 素 个 数 . 称 为 子 序 列 的 长 度 . 
定义 3.2 设 铸 和 YY 是 两 个 序列 .如 果 Z 既 是 XX 的 子 序列 ,也 是 Y 的 子 序列 , 则 称 
Z 是 X 与 Y 的 公共 子 序列 . 
例 3.6 最 长 公共 子 序列 问题 . 
给 定 序列 


才 ww 加 
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X =r rn >, Y=<y ,yy > 

求 X 和 了 的 最 长 公共 子 序列 . 

例如 ,X=<A,B,C,B,D,A,B>,Y=<B,D,C,A,B,A> ,它们 的 一 个 最 长 的 公共 子 
序列 是 <B,C,B,A> ,长 度 是 4. 当然 还 有 另 一 个 最 长 公共 子 序列 , 即 二 B,C,A,B 二 .我 们 
的 要 求 是 求 出 一 个 最 长 的 公共 子 序列 . 当 最 长 公共 子 序列 不 唯一 时 ,不 同 的 算法 的 求解 结果 
可 能 不 一 样 , 但 是 它们 的 长 度 都 相等 . 

假设 m 三 n. 蛮 力 算法 可 以 这 样 做 : 找 出 X 的 每 个 子 序 列 X" ,并且 把 X 和 了 进行 比较 ， 
看 看 X 是 否 也 是 Y 的 子 序列 . 如 果 是 ,那么 X' 就 是 X 与 了 的 公共 子 序列 . 当 所 有 的 比较 完 
成 后 就 找到 了 X 与 Y 的 最 长 公共 子 序列 . 在 选择 X' 时 ,每 个 X 的 元 素 有 两 种 可 能 的 选择 : 
属于 X' 还 是 不 属于 X“ ,于 是 X 有 2" 个 子 序列 . 如 果 检 查 X' 与 Y 需要 On) 时间, 那么 整个 
算法 需要 O(z2") 时 间 ,这 是 一 个 指数 时 间 的 算法 . 

考虑 动态 规划 算法 ,首先 需要 思考 如 何 界定 子 问 题 的 边界 . 假设 子 问题 的 X 和 Y 的 起 
始 位 置 都 从 第 一 个 元 素 开 始 ,X 的 终止 位 置 是 第 i 个 元 素 ,Y 的 终止 位 置 是 第 j 个 元 素 ,那么 

Xi = zr Ti > Yj = yy yj > 

就 代表 了 由 i 和 j 共同 界定 的 子 问题 的 输入 . 

下 面 分 析 子 问题 之 间 的 依赖 性 质 ,这 是 设计 递 推 关系 的 基础 . 设 

Xi = rT Ti > Yj = yy > Zr = ir > 

如 果 Zi 为 X 和 YY; 的 最 长 公共 子 序列 ,那么 : 

(1) 车 zi 二 yj ,那么 二 zi 二 yj, 且 Zi-1 是 Xi 与 Y-1 的 最 长 公共 子 序列 . 如 若 不 然 , 一 
定 存在 X;-1 和 Yj;-1 的 最 长 公共 子 序列 Z .12 | 二 |2Zi-11. 在 Z 后 面 加 上 x 就 得 到 一 个 
Xi 与 Y; 的 公共 子 序列 , 且 它 的 长 度 为 12' 1 十 1>1Z-1 二 1=12| ,与 和 是 X; 与 Y) 的 最 
长 公共 子 序 列 矛 盾 . 

如 果 z; 与 yj 不 等 ,或 zx; 不 是 ,或 yy 不 是 .下面 的 (2) 和 (3) 分 别 对 应 于 这 两 种 情况 ， 

(2) 若 zi 关 yj sx 天 zi 那么 和 是 XX;-1 与 Y; 的 最 长 公共 子 序列 . 

(3) 车 xz; 关 yj ,zh 关 yj ,那么 Zi 是 X; 与 Y-1 的 最 长 公共 子 序列 . 

设 C[i, 门 表示 X; 与 Y 的 最 长 公共 子 序列 的 长 度 . 根据 上 述 分 析 , 得 到 优化 函数 的 递 


推 关系 如 下 : 
CLis] = th ie 如 果 i,j 这 0,zi = yy; 
max{C[isj 一 1j;C[Li 一 157]} 如 果 i5j 之 0szi 关 光 
CL0, 站 = CLi,0] =0 如 果 1 二 im, 1 二 jn 
上 述 的 递 推 公式 恰好 反映 了 前 面 的 三 种 情况 . C[i, 门 =C[i 一 1,j 一 1 十 1 对 应 于 情况 (1); 
CEi 一 1, 记 与 CL[i.j 一 1 则 分 别 对 应 于 情况 (2) 和 (3). 当 i 二 0 或 者 j= 二 0 时 ,两 个 序列 中 的 一 个 
序列 是 空 序列 , 那么 公共 子 序列 只 能 是 空 序列 ,因此 C[0, 站 二 C[i,0] 二 0, 这 是 递 推 关系 的 初 值 . 
根据 这 个 递 推 关系 和 初 值 .不 难 给 出 算法 迭代 实现 的 伪 码 描述 . 
算法 3.4 LCS(X,Y,m,n) 
输入 : 序列 X, 了 ,其 中 X[1..m],Y[1..n] 
输出 : 最 长 公共 子 序列 长 度 C[i, 门 ,标记 B[i,j], 1<i<m,1<j<n 
1. for i<l to m do // 行 1 一 4 处 理 初 值 
入 C[Li,0]<—0 
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3. for i<l1 to n do 

4 C[o ,可 < 一 0 

5. for il to m do 

6. for j<1 to n do 

7 外 = //X[ 门 与 Y[j] 被 选 入 公共 子 序列 
8 then C[i,j]<C[i—1,j—1J+!1 
9. B[isj]—"™" 

10. else if C[i—1,j]>C[Li,j—1] 
lL then C[i,j]j<C[i—1,;] 
局 i 

13. else C[Li,j]<C[i,j—1] 
14. MD” 


上 述 算法 计算 了 所 有 子 问 题 的 最 长 公共 子 序列 的 长 度 C[i,j]. BL[i,j] 是 标记 函数 , 记 
录 X; 与 Y; 的 最 长 公共 子 序 列 的 元 素 是 怎样 选取 的 . 有 三 种 标记 ,用 “™” 表 示 序 列 X; 与 六 
的 最 后 项 zx; 一 WwW, 已 被 选 人 最 长 公共 子 序列 ;用 "人 ”表示 在 X 与 Y; 的 最 长 公共 子 序列 选择 
时 不 考虑 ri 它们 的 最 长 公共 子 序列 就 是 X -与 的 最 长 公共 子 序列 ;用 "< 一 ”表示 在 X， 
与 Y; 的 最 长 公共 子 序列 选择 时 不 考虑 y; ,它们 的 最 长 公共 子 序列 就 是 X; 与 Y;_1 的 最 长 公 
共 子 序列 . 设立 这 些 标记 是 为 了 追踪 解 . 可 以 从 后 向 前 追踪 这 些 标记 , 遇 到 “、” 标 记 时 ,就 
把 zx; 加 入 到 最 长 公共 子 序列 中 . 如 果 遇 到 其 他 两 种 标记 ,表示 没有 元 素 加 入 最 大 公共 子 序 
列 , 这 时 仅 需 按 照 标 记 的 指示 向 前 继续 追踪 . 追踪 解 的 算法 在 下 面 给 出 . 


算法 3.5 Structure Sequence(B, i, 7 


输入 : B[i, 站 

输出 : X 与 了 的 最 长 公共 子 序列 

1. if i=0 or j=0 then return // 一 个 序列 为 空 
2. 计 B[i,j]="™" 

3. then 输出 XX[ 站 

4. Structure Sequence(B,i—1,j—1) 

5. else if B[i,j}]="1" then Structure Sequence(B,i—1,)) 
6 else Structure Sequence (B,i.j—1) 


回顾 这 个 问题 开始 时 所 给 出 的 实例 : 
= BB DNB SE, Y= BDCWBAS 

其 中 m= 二 7,n 二 6. 算 法 LCS 计算 的 C[i, 门 和 B[i, 站 分 别 如 表 3.7 和 表 3. 8 所 示 . 在 表 3. 8 
中 用 连续 的 灰色 表格 表示 追踪 过 程 : 
BL[75s6] -= BL6:6] -= BL5,5] —* BL45] -> BL34] 一 
B[L3,3] > B[2,2] > BL[2,1] >j=0 
其 中 吾 [6,6] 王 如 [4,5] 一 瑟 [3,3] 一 了 [2,1] 一 “<% ”这 就 得 到 解 Z 二 过 zx0 yzayN4y26 记 二 
<B,C,B,A>. 

最 后 我 们 分 析 这 个 算法 的 时 间 复 杂 度 . 算法 LCS 的 行 1 和 行 2 是 O(m) 时 间 , 行 3 一 
4 是 O(w) 时 间 , 行 5 和 行 6 的 循环 执行 OC(mn) 次 ,循环 内 部 的 运算 是 O(1) 时 间 , 于 是 算法 
的 总 时 间 是 OGmn). 此 外 ,追踪 解 的 Structure Sequence 算法 从 i 一 m., j 二 n 开始 .每 找到 一 
个 标记 B[i. 门 ,算法 执行 常数 操作 ,然后 或 者 i 和 j 同时 减 1, 或 者 i 减 1, 或 者 j 减 1, 总 之 


击 避 器 
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i 十 j 至 少 减 1. 由 于 初始 i 十 j 二 m 十 n, 因 此 至 多 m 十 n 次 在 标记 上 的 操作 ,算法 将 结束 ,于 是 
算法 的 时 间 是 Olm 十 .我 们 看 到 这 个 算法 把 蛮 力 算法 的 O(n2”) 时 间 降低 到 OCmn) 时 间 . 


表 3.7 优化 函数 CLi.j] 


0 C[L0,0]=0 | CL0,1]=0 | C[L0,2] [0,3] [0,4] [ 

i | tls01=0 | HU=0 | outog=o| 可 oo | 可 bs | | 可 36]=1 
2 | c[2,0]=0 | c[2,1]=1 | C[2,2]=1 | Cc[2,3]=1 | CL2,4]=1 | C[2,5]=2 | C[2,6]=2 
3 Cc[3,0]=0 | CL3,1]=1 | CL3,2]=1 | CL3,3]=2 | CL3,4]=2 | CL3,5]=2 | C[3,6] 一 2 


6 CL6,0]=0 | CL6,1]=1 | CL6,2]=2 | CL6,3]=2 | CL6,4]=3 | CL6,5]=3 | CL[L6,6]=4 


7 | cL7;0]=0 | c[7,1]=1 | CL?7,2]=2 | CL7,3]=2 | CL7,4]=3 | C[7,5]=4 ele 


表 3.8 标记 函数 B[i,j] 
1 2 3 4 5 6 
| B[1,1] 王 个 B[1,2] 王 个 B[1.,3]= B[1,4]="™ B[1,5] 王 < B[1,6]=" 
2 B[2,1]=™、 | B[2,2]=<— | B[2.3]=* B[2,4] 一 个 B[2,5]="™ B[2,6]=* 
3 B[3,1]= B[3,2] 一 个 B[3,3]=™ | B[3,4]=< | B[3,5] 一 个 B[3,6] 一 个 
4 B[4,1]="™" B[4,2] 一 个 B[4,.3] 一 个 B[4,4] 一 个 B[4,5]=™、 B[4.,6]=* 
5 B[5,1]= 1 B[5,2]=" B[5,3] 王 个 B[5,4] 一 个 B[5,5] 一 个 B[5,6] 一 个 
6 B[6,1] 王 个 B[6.2] 王 个 B[6,3] 王 个 B[6,4]=" B[6,5] 一 个 B[6,6]=™、 
vi B[7,1]=™、 B[7,2] 一 个 B[7,3] 一 个 B[7,4] 一 个 B[7,5]=™、 B[7,6]= 1 


3.3.4 图 像 压缩 


计算 机 中 的 图 像 由 一 系列 像 点 构成 ,每 个 像 点 称 为 一 个 像素 ,图 像 分 辩 率 越 高 ,使 用 的 
像素 就 越 多 ,例如 Windows 桌面 的 图 片 经 常 使 用 的 设置 是 1024X768 个 ,大 概 达到 10* 量 
级 . 图 像 传输 和 视频 处 理 有 时 在 1 秒 钟 内 要 处 理 几 十 帧 图 片 .这些 图 片 的 像素 就 很 可 观 了 ， 
因此 图 像 处 理 常常 需要 大 量 的 存储 空间 和 高 的 处 理 速 度 , 图 像 压缩 问题 就 成 了 计算 机 科学 
技术 中 的 重要 研究 课题 之 一 . 

以 黑白 图 像 的 处 理 来 说 明 图 像 压缩 中 的 问题 . 每 幅 黑 白 图 像 由 像 点 构成 ,每 个 像 点 具有 
灰 度 值 , 用 0 一 255 之 间 的 整数 表示 . 如 果 每 个 整数 都 用 相同 的 二 进 制 位 来 表示 ,那么 需要 用 
8 个 二 进 制 位 . 假设 一 幅 图 像 有 个 像素 ,那么 这 个 像素 的 灰 度 值 构 成 一 个 整数 序列 

P=<=<p,p,",p, > 

其 中 p; 表示 第 i 个 像素 的 灰 度 . 存储 这 幅 图 片 时 ,可 以 像 数组 一 样 连续 把 这 些 整数 存 起 来 ， 
共 需 要 8n 个 二 进 制 位 . 
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下 面 考虑 一 种 图 像 压 缩 方法 . 一 般 来 说 ,在 一 幅 图 片 中 许多 连续 区 域 中 像 点 的 灰 度 值 是 
接近 的 . 比如 有 些 交通 标志 图 片 , 大 片 的 区 域 是 白 的 .可 能 少量 区 域 有 颜色 ,而 且 是 比较 单调 
的 颜色 . 对 这 样 的 图 片 是 否 可 以 采用 分 段 存储 的 方法 : 对 灰 度 值 较 小 的 段 的 像素 采用 比较 
少 的 位 数 ,比如 2 位 ;对 灰 度 值 较 大 的 段 的 像素 采用 较 多 的 位 数 ,比如 8 位 ,这 样 就 可 能 减少 
空间 的 占用 . 这 就 是 变 位 压缩 技术 的 基本 想法 . 这 种 技术 节省 了 空间 ,但 在 读 取 图 像 时 带 来 
了 新 的 问题 . 在 每 个 像素 8 位 的 存储 方法 中 , 读 取 图 像 时 每 8 位 就 是 一 个 像素 的 灰 度 值 ,不 
会 出 错 .但 是 对 于 分 段 压 缩 的 图 像 , 看 起 来 就 是 一 个 长 长 的 0-1 序列 . 当 读 取 这 个 序列 时 , 怎 
么 知道 每 段 的 划分 位 置 及 每 段 像素 占用 的 二 进 制 位 数 呢 ? 这 里 需要 对 段 的 划分 和 上段 中 像素 
使 用 的 二 进 制 位 数 ( 要 求 同 一 段 内 不 同 像素 用 的 存储 位 数 都 一 样 ) 给 出 明确 的 信息 . 为 此 ,我 
们 对 每 个 段 给 出 两 个 整数 值 ,一 个 表示 该 段 含 有 的 像素 个 数 ,一 个 表示 每 个 像素 所 占用 的 二 
进 制 位 数 . 比如 第 i 段 ,有 /i 个 像素 ,每 个 像素 用 b; 位 . 由 于 某 些 技术 要 求 ,规定 每 段 像素 总 
数 不 超 过 256, 即 /; 志 256. 于 是 可 以 用 8 位 来 表示 Li;(8 位 二 进 制 数 恰好 有 256 个 值 ). 此 外 ， 
由 于 每 个 灰 度 值 在 0 一 255 之 间 ,表达 每 个 灰 度 值 所 用 二 进 制 数 的 位 数 b; 不 超过 8, 于 是 记 
录 凡 还 需要 3 个 二 进 制 位 . 对 每 段 来 说 ,这 额外 的 11 位 作为 段 头 信息 . 从 直觉 上 来 说 ,分 段 
越 多 ,每 段 内 部 像素 所 占用 的 位 数 会 减少 ,但 过 多 的 段 头 会 消耗 较 多 的 二 进 制 位 . 相反 ,分 段 
越 少 , 段 内 像素 的 空间 消耗 会 增加 ,但 是 段 头 消耗 少 . 

请 看 下 面 的 例子 . 设 输 入 的 灰 度 值 序列 是 : 

BP = Wal2s T5256: 1 0ali221 

考虑 下 面 3 种 分 段 方法 : 
准 法 1 ,=< W020 = 过 2 = 
分 法 2 Si = 之 10512;51552555,1y2,1;1;25251;1 > 
i 

人 

Si = = 
分 法 1 有 3 段 ,第 1 段 3 个 像素 ,每 个 像素 用 4 位 ;第 2 段 1 个 像素 ,每 个 像素 用 8 位 ;第 3 段 
8 个 像素 ,每 个 像素 用 2 位 ;加 上 3 个 段 头 ,每 个 段 头 11 位 ,总 计 位 数 是 : 

4Xx3 十 8x1 十 2X8 二 3X1ll 一 69 
分 法 2 有 1 段 ,12 个 像素 ,每 个 像素 用 8 位 , 段 头 11 位 ,总 计 位 数 是 ; 
8X12 十 11 = 107 
分 法 3 有 12 段 ,前 3 段 的 像素 用 4 位 ,第 4 段 像素 用 8 位 ,后 面 有 5 段 像 素 用 1 位 ,3 段 像素 
用 2 位 ,还 有 12 个 段 头 ,每 个 11 位 .总计 位 数 是 : 
4X3 十 8X1 十 1X5 十 2X3 十 11X12 一 163 

看 起 来 分 法 1 占用 的 位 数 最 少 . 我 们 的 问题 是 寻找 存储 位 数 最 少 的 分 段 方法 . 

例 3.7 图 像 压缩 问题 . 

给 定 非 负 整数 序列 P= 二 pi ,ps，…,p, 记 ,其 中 pi 为 第 i 个 像素 的 灰 度 值 ,采用 变 位 压 
缩 存储 格式 ,如 何 对 P 进行 分 段 ,以 使 得 存储 P 占用 的 二 进 制 位 数 达 到 最 少 ? 

使 用 动态 规划 算法 . 先 考虑 子 问题 的 划分 边界 . 这 

[Ps Pm P| 个 问题 比较 简单 ,每 个 子 问题 的 输入 都 从 pp 开始 ,第 
Pry /个 灰 度 值 ”i 个子 问题 的 输入 P; 到 第 i 个 像素 值 p; 结束 , 即 已 ,一 

图 3.5 子 问题 的 归 约 二 pi:ps，…,p; 福 .如 图 3.5 所 示 , 如 果 最 后 一 段 的 灰 度 
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值 有 j 个 ,其 中 1<j 二 min{256, 引 ,那么 剩余 部 分 将 归 约 为 输入 是 Pi_j 二 二 pi ,ps，…,pi-j 的 
子 问 题 . 

下 面 考虑 子 问 题 之 间 的 依赖 关系 . 设 S[ 门 表示 输入 为 P; 时 按 最 优 分 段 存储 所 使 用 的 
二 进 制 位 数 . 假设 最 后 一 段 是 第 m 段 , 记 作 S,, 且 S。 含有 j 个 灰 度 值 , 即 S, 二 二 pi_j+1，…， 
pi 二 .存储 S 的 每 个 灰 度 值 需要 的 二 进 制 位 数 记 作 b[i 一 j 十 1, 门 , 它 应 该 是 用 二 进 制 表 示 
Sw 中 的 最 大 灰 度 值 所 占用 的 位 数 , 即 

= =| logs(maxp: + 1) |<s 
由 于 5。 含有 j 个 灰 度 值 ,于 是 需要 jX6b[i 一 j 十 1, 站 个 二 进 制 位 . 剩 下 就 是 考虑 前 ;一 ) 个 灰 
度 值 的 最 优 分 段 所 占用 的 位 数 , 这 恰好 是 子 问 题 P;_; 的 最 优 解 SC 一 门 . 于 是 在 最 后 一 段 为 
j 个 灰 度 值 时 的 最 少 的 位 数 是 : 
S[i 一 门 十 j Xb[i 一 j 十 1: 引 十 11 
其 中 11 是 该 段 段 头 的 空间 消耗 . 最 后 分 段 的 灰 度 值 个 数 j 可 以 选择 1,2,…,min{256, 站 中 
的 每 一 个 值 ,我 们 必须 对 所 有 可 能 的 j 值 进行 上 述 计算 ,并 从 中 选 出 最 小 的 位 数值 ,这 个 最 
小 值 就 是 S[ 门 . 根据 上 述 分 析 ,不 难得 到 关于 优化 函数 S[ 门 的 递 推 关 系 : 
S[i]= min (SC 一 门 二 7 Xb[i 一 j 十 1; 引 十 11} 
1<j<min(i,256} 
SL0] =0 

算法 实现 采用 和 迭代 方法 , 子 问题 的 输入 从 Pi ,P,,…, 最 后 达到 已 . 对 给 定 的 输入 P;, 算 
法 从 最 后 分 段 开始 考虑 ,依次 处 理 像 素数 为 1,2,… ,直到 min{256,z 的 分 段 结果 .用 S[ 门 保 
留 对 应 于 最 优 分 段 的 最 小 位 数 , 并 用 了 /[ 疏 记录 达到 最 少 位 数 时 最 后 一 段 的 灰 度 值 个 数 . 如 
果 随 着 分 段 像素 灰 度 值 个 数 的 增加 ,得 到 了 比 当 前 的 位 数 更 少 的 位 数 , 那 么 就 用 新 的 位 数 替 
换 原来 的 位 数 ,同时 更 新 最 后 段 的 像素 个 数 ![ 门 . 算法 的 伪 码 描述 如 下 : 

算法 3.6 Compress(P.n) 


输入 : 数组 P[1..n] 
输出 : 最 小 位 数 SLnj],U[1..n] 


1. Lmax<*-256; header<-11; SL[0]<-0 //Lmaz 为 最 大 段 长 ,header 为 每 个 段 头 占用 空间 
2. for il to n do 

3.  b[]<Lengih( PLi]) // 表 示 第 i 个 像素 灰 度 的 二 进 制 位 数 

4. bmaz<-b[i] //3 一 6 行 分 法 的 最 后 一 段 只 有 P[ 门 一 个 像素 
5.  S[i]<S[i—1]+bmax 

6. <1 

7. for j<2 to min{i, Lmaxr} do // 最 后 段 含 j 个 像素 , j= 二 2,… ,min{i,256} 

8 if bmaxr<b[i—j+1] //8 一 9 行 统一 段 内 表示 像素 的 二 进 制 位 数 

9. then bmaz<-b[i—j+1] 

10. 证 S[i]>S[i—j]+ j*bmax // 找 到 更 少 的 位 数 

lk then S[i]<—S[i—j]+j * bmar 

万 . Uj 


13. S[i]<S[i]+header 
下 面 给 出 一 个 运行 实例 . 设 输入 P= 二 10,12,15,255,1,2 放 .假设 S[1],S[2],*…,S[5] 
已 经 计算 完成 , 且 
S[ 训 = 5 到 三 境 ， 匡 下 三 区 5 = 六 5S[ 史 = 0 


动态 规划 


交 寻 三 下， 了 末 三 区 ， 开 可 三 入 页 纪 二 证， 王后 二 2 

算法 迭代 计算 的 最 后 一 个 子 问题 , 即 对 ;一 6 的 计算 过 程 说 明 如 下 . 初始 分 段 ,最 后 段 含 
有 1 个 像素 灰 度 ( 算 法 3.6 的 行 3 到 行 6), 即 j= 二 1, 这 时 该 像素 灰 度 值 是 2, 占用 位 数 
bmazx 王 6[6,6] 二 2, 加 上 上段 头 11 位 9 ,于 是 得 到 

S[6] = S[5J 十 1X2 十 11 = 50 十 13 = 二 63，l[6] 一 1 

接着 j 二 2, 最 后 段 含有 两 个 像素 灰 度 值 ,这 时 bmazx 二 b[5,6] 二 2, 于 是 最 后 一 段 占用 位 数 等 
于 2X2 一 4 位 ,这 个 位 数 计算 出 是 57, 即 
S[6] = S[L4] 十 2X2 十 11 一 42 十 15 一 57，/[6] 一 2 
57 比 63 小 ,于 是 更 新 了 S[L6] 和 人 46]. 下 一 步 ) 一 3, 最 后 段 含 有 3 个 像素 灰 度 值 , 这 时 oraz 一 
[4,6] 一 8, 于 是 最 后 一 段 占 用 位 数 等 于 3X8 一 24 位 ,计算 结果 是 : 
S[3] 十 3X8 十 11 = 23 十 35 二 58 
由 于 这 个 数 比 57 大 ,于 是 不 再 更 新 SL6]. 后 面 几 步 计算 和 这 个 过 程 类 似 , 得 到 的 最 小 位 数 
分 别 是 62、66 和 59, 它 们 都 大 于 57, 因 此 最 终 保留 的 SL6] 二 57,L[6] 二 2. 图 3.6 给 出 了 整个 
计算 步骤 ,灰色 区 域 表示 最 后 一 段 的 范围 . 


[Lv 12 15 255 1 2 
SG6F50 1X2+11 
[wv 12 15 | 255 1 2 
PE 3x2+11 
10 12 15 | 2 1 2 
SIE23 3x8+11 
[vw 2 ”| 醒 本 是 王 汪 林 关 轴 光 旨 
SFI9 4X8+11 
10 12 15 | 255 1 2 
SIE 5x8+11 
6x8+11 
图 3.6 一 个 实例 


在 上 述 计算 完成 以 后 ,可 以 根据 1[6j],L[5j,…,L[L1j] 的 值 向 前 追踪 问题 的 解 . 开始 
6 二 2, 于 是 知道 在 最 优 分 段 中 的 最 后 段 长 度 是 2, 即 含有 两 个 像素 灰 度 值 . 那么 剩 下 的 是 
6 一 儿 6] 一 4 个 像素 灰 度 序列 的 子 问题 .再 查 [4] ,看 到 上 L4] 一 1, 这 说 明 最 优 分 段 中 的 下 一 段 的 
长 度 是 1, 只 含有 1 个 像素 灰 度 值 . 接着 需要 检查 规模 等 于 4 一 人 人 4] 一 3 的 子 问题 .由 于 /[3] 一 
3, 这 说 明 剩 下 的 3 个 像素 灰 度 值 都 在 同一 段 里 . 于 是 得 到 对 应 于 最 小 位 数 的 最 优 分 段 是 ， 

<10,12,15 二 > 255>,， <1,2> 

这 个 追踪 解 的 过 程 可 以 用 算法 实现 . 相关 的 伪 码 在 下 面 . 


@ ”把 段 头 所 占用 的 11 位 加 上 ,是 为 了 与 图 3. 6 中 不 同 划 分 占用 的 位 数 一 致 . 在 算法 3. 6 的 伪 码 中 ,不 是 每 次 划分 
后 都 做 1 次 加 法 ,而 是 找到 最 优 划 分 、 确 定 了 最 后 分 段 的 位 置 之 后 才 加 段 头 的 11 位 . 两 种 方法 的 最 优 划 分 和 占用 位 数 是 
一 样 的 ,但 这 个 过 程 比 算法 做 的 加 法 次 数 更 多 . 
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算法 3.7 Traceback(n,/) 


输入 : 数组 / 
输出 : 数组 C //C[7] 是 从 后 向 前 追踪 的 第 j 段 的 长 度 
i, 3=1 //i 为 正在 追踪 的 段 数 


2. while 7 天 0 do 

3. CL]<iLn] 

4. n=<—n—l[Ln] 

5. jj+l 

后 考虑 算法 的 时 间 复 杂 度 . 算法 Compress 在 行 2 执行 O(n) 次 , 行 3 一 6 是 常数 工作 

量 , 行 7 虽然 是 for 循环 ,但 是 它 至 多 执行 256 次 ,不 随 而 增加 ,也 是 常数 次 , 行 8 一 12 的 运 
算 也 是 常数 工作 量 ,因此 在 行 2 的 for 循环 内 部 工作 量 总 计 是 O(1) ,于 是 该 算法 的 时 间 复 
杂 度 是 O(n). 再 考虑 追踪 解 的 代价 , 不 难看 出 算法 Traceback 的 while 循环 执行 O(n) 次 ， 
循环 内 部 都 是 常数 次 操作 ,于 是 压缩 算法 的 时 间 复 杂 度 是 O(n). 


3.3.5 最 大 子 段 和 


许多 实际 问题 涉及 一 个 连续 区 间 的 数量 性 质 . 比如 国际 期 货 市 场 内 某 种 商品 在 某 个 月 
的 第 1,2,…,31 天 内 的 价格 涨幅 分 别 记 为 wm ,as ,…',aai. 若 某 天 价格 下 降 , 这 天 的 涨幅 就 是 
负 值 . 我 们 想 知道 在 哪些 连续 的 天 内 该 商品 价格 具有 最 高 涨幅 ,究竟 涨 了 多 少 . 这 个 问题 可 
以 抽象 为 下 述 子 段 和 问题 . 

设 A= 过 a ,as，… sas 记 是 个 整数 的 序列 , 称 二 a;,…,aj 二 为 该 序列 的 连续 子 序列 ， 


其 中 1 过 i 志 j 志 n. 子 序列 的 元 素 之 和 >vax 称 为 A 的 子 段 和 . 


例如 ,A= 二 一 2,11, 一 4,13, 一 5, 一 2 之 ,那么 它 的 子 段 和 如 下 : 
度 是 1 的 子 段 和 有 ;: 一 2,11, 一 4,13, 一 5, 一 23 
度 为 2 的 子 段 和 有 : 9,7,9.8. 一 7 
度 为 3 的 子 段 和 有 : 5,20.4.6 
度 为 4 的 子 段 和 有 : 18,15.2 
度 为 5 的 子 段 和 有 : 13,13 
长 度 为 6 的 子 段 和 有 : 11 
其 中 的 最 大 子 段 和 是 11 一 4 十 13 二 20. 
例 3.8 最 大 子 段 和 问题 . 
给 定 nn 个 整数 的 序列 A== 二 a ,az , ,as 二 , 求 
wax. max 2 


1<i<j<n 在 


木林 森森 森森 


求解 子 段 和 的 亦 力 算法 是 枚 举 A 的 所 有 连续 子 序列 并 且 求 和 ,通过 比较 找 出 具有 最 大 
和 的 子 序列 . 下 面 是 这 个 算法 的 伪 码 . 
算法 3.8 Enumerate 


输入 : 数组 A[1..n] 
输出 : swum, first, last //sum 为 最 大 子 段 和 ,Jirst 与 last 分 别 是 和 的 首 未 位 置 


动态 规划 


1. sum<-0 

2. for il to n do /大 为 当前 和 的 首位 置 

3. for ji to n do //j 为 当前 和 的 末 位 置 

4. thissum<—0 //ihissum 为 AT 到 A[ 门 之 和 
5 for k<i to jj} do 

6. thissum=<—thissum+ A[k] 

名 if thisswm> sum 

8. then sum<—thissum 

9. Jirst< // 记 录 最 大 和 的 首位 置 

10. last<—j // 记 录 最 大 和 的 末 位 置 


算法 Enumerate 的 行 2, 行 3, 行 5 是 3 个 for 循环 ,每 个 执行 O(n) 次 ,循环 体内 部 是 常 
数 操作 ,于 是 该 算法 的 时 间 复 杂 度 是 O(n3). 

下 面 尝试 一 下 分 治 策略 . 和 最 邻近 点 对 的 算法 类 似 ,我 们 可 以 在 ln/2 有 的 位 置 将 A 划分 
成 A! 和 A 前 后 两 半 , 于 是 A 的 最 大 子 段 和 可 能 是 三 种 情况 : 出 现在 A; 部 分 ,出 现在 A， 
部 分 ,出 现在 横 跨 两 边 的 中 间 部 分 . 前 两 种 情况 恰好 对 应 于 两 个 规模 减 半 的 子 问 题 ,第 三 种 
情况 需要 特殊 处 理 一 下 . 假设 原 问题 的 输入 是 A[1..n], 中 间 分 点 k==ln/2J, 那 么 前 半 部 分 子 
问题 的 输入 是 A[1..&], 后 半 部 分 子 问 题 的 输入 是 A[k 十 1,n]. 在 第 三 种 情况 下 , 设 这 个 最 
大 和 是 A[Lp.. qj, 那么 pk&,g 宇 k 十 1, 从 A[Lp] 到 A[k] 的 元 素 都 在 A 中 ,从 A[k 十 1 到 A 
[qj 的 元 素 都 在 A, 中 .我 们 只 需要 从 A[k] 和 A[k 十 1 分别 向 前 和 向 后 求 和 即 可 . 比如 以 A 
[p..kj 的 计算 为 例 , 依 次 计算 ALk..&],A[k 一 1,k],…,A[1..&], 记 下 其 中 最 大 的 和 Si1, 即 A 
[p..&j. 对 右 半 部 可 以 同样 处 理 ,只 不 过 扫描 方向 相反 ， SS 
得 到 的 S; 就 是 ALA 十 1..g] 的 元 素 之 和 . 当 两 个 方向 的 
扫描 都 完成 之 后 ,Si 十 S; 就 是 横 跨 中 心 的 最 大 和 ,其 边 “一 人 gm- | 一 ”hsm 
界 从 p 到 9g. 这 三 种 情况 都 计算 完成 以 后 ,通过 比较 就 40] … 4 内 4 … 4 四 
可 以 确定 A 的 最 大 子 段 和 .图 3.7 说 明了 这 种 分 治 处 理 图 3.7 分 治 算法 
的 思想 ,算法 的 伪 码 描述 如 下 . 


算法 3.9 MaxSubSum(A,left,right) 

输入 : 数组 A,left,right 分 别 是 A 的 左 、 右 边界 ,1<left<right 

输出 : A 的 最 大 子 段 和 swm 及 其 子 段 的 前 后 边界 

1. if left=right then return max{A[le/t]. 0} 

2. center<l(leftt+right)/2 ] 

3. leftsum<—MaxSubSum(A ,left,center) // 子 问题 Ai 
4. righsum<—-MaxSubSum(A ,centert1,right) // 子 问题 A: 
5. S11<—Ai[center] // 从 center 向 左 的 最 大 和 
6 

é 

8 
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. SA,[centert+1] // 从 center 十 1 向 右 的 最 大 和 
。 SuI< SI 十 Sz 
.if leftsum>sum then sum<-leftsum 


.ff rightsum>sum then sum<-rightsum 

算法 计算 出 子 问题 的 最 大 子 段 和 的 同时 也 可 以 记录 下 这 个 和 的 前 后 边界 以 便 最 终 输出 
时 使 用 . 下 面 分析 这 个 分 治 算法 的 运行 时 间 . 设 算法 对 规模 为 n 的 输入 运行 时 间 是 TT(m) , 行 
3 和 行 4 是 递归 调用 ,每 个 子 问题 是 原来 问题 规模 的 一 半 , 因 此 需要 2T(n/2) 时 间 . 行 5 和 
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行 6 的 处 理 需 要 扫描 A 的 每 个 元 素 , 总 计 需 要 O(n) 时 间 , 于 是 得 到 递 推 方程 : 
T(n) = 2T(n/2)+O(n), T(1)=0 
该 方程 的 解 是 T(n) 二 O(nlogn). 

下 面 尝试 动态 规划 算法 , 先 考虑 子 问题 划分 . 一 般 情况 下 ,如果 能 用 一 个 参数 来 表示 子 
问题 的 边界 , 则 尽量 采用 一 个 参数 . 先 考 虑 所 有 子 问 题 都 从 AL1] 开 始 , 对 于 给 定 的 i, 子 问题 
的 输入 是 数组 A[1.. 可 ,其 中 1 二 i<<n. 如 果子 问题 的 优化 函数 值 C[ 门 表示 A[1.. 疏 的 最 大 子 
段 和 ,那么 对 优化 函数 C[j](j 二 丫 来 说 , 它 与 C[ 门 之 间 依 赖 关系 的 确定 比较 困难 . 因为 使 得 
AL1.. 门 达到 最 大 和 的 子 段 的 最 后 一 个 元 素 不 一 定 是 ALi 本 身 , 当 以 这 个 子 段 为 基础 来 构 
造 子 问题 A[1.. 门 的 解 时 ,不 得 不 考虑 它 后 面 其 他 元 素 的 影响 . 于 是 需要 更 多 的 额外 计算 ， 
这 些 计 算 也 许 要 用 到 O(n) 时 间 , 这 将 降低 算法 的 性 能 . 比如 

A = 二 2, 一 5,8,11, 一 3,4,6 过 
A[1..5] 的 输入 是 子 序 列 <<2 ,一 5,8,11, 一 3 之 ,最 大 子 段 和 C[5]=8 十 11=19. 在 计算 后 面 
的 子 问题 A[1..6] 时 ,不 能 直接 把 对 应 于 AL1..5] 最 优 解 的 子 段 二 8,11 二 组 合 进来 ,因为 在 
11 后 面 还 有 一 3, 它 对 和 也 有 着 影响 . 很 可 能 会 破坏 优化 原则 . 为 了 得 到 效率 更 高 的 算法 ,我 
们 需要 在 子 问题 之 间 建 立 一 个 简单 的 递 推 关系 ,为 此 需要 改变 优化 函数 的 含义 ， 
定义 CL 订 是 输入 AL1.. 英 中 必须 包含 元 素 A[ 门 的 最 大 子 段 和 , 即 
C[i] = max{ 之 4D]} 
在 上 面 A 王 二 2, 一 5,8,11, 一 3.4.6 二 的 例子 中 .这样 的 优化 函数 值 是 : 
全 河 三 和 ,本 引 3, C[3] = 8, C[4] = 19， 
Sl CL = 0 GID = 
不 难看 到 这 与 原始 问题 的 函数 是 不 一 样 的 . 在 原始 问题 中 对 应 于 同样 子 问 题 的 最 大 子 段 和 
(也 是 原始 问题 的 优化 函数 值 ) 分 别 是 : 2,2.8,19.19.20.26. 

针对 这 种 优化 函数 的 新 定义 ,C[ 让 和 C[i 十 1] 是 什么 关系 呢 ? CL[i 十 1] 可 以 通过 C[ 门 直 
接 得 到 . 因为 如 果 A[1..i 十 1] 的 子 段 A[k..i 十 1] 是 使 得 C[i 十 1] 达 到 最 大 和 的 子 段 , 那 么 
A[k.. 让 一 定 是 使 得 C[ 训 达到 最 大 和 的 子 段 . 如 车 不 然 , 存 在 一 个 使 得 C[ 门 达到 更 大 和 的 子 
段 A[z.. 站 ,那么 在 A[t.. 刀 后 面 加 上 A[i 十 1] 所 得 到 的 子 段 A[z..i 十 1 之 和 将 大 于 C[i 十 1]. 
这 与 C[i 十 1] 是 A[1..i 十 1] 以 元 素 A[i 十 1] 作 为 最 后 元 素 的 最 大 子 段 和 矛盾 . 这 恰好 验证 了 
这 样 定义 的 优化 函数 满足 优化 原则 . 于 是 ,我 
们 在 考虑 怎样 选择 才能 使 得 C[i 十 1] 达 到 最 | 4 4 … 和 | 和 
大 值 时 ,只 要 考虑 一 个 问题 : 是 否 需要 把 C[ 门 最 大 子 段 和 CD 
加 到 A[i 十 1] 上 ? 而 这 取决 于 C[ 门 是 否 大 于 
0. 这 个 递 推 关 系 如 图 3. 8 所 示 . 

令 C[ 门 表示 最 后 一 项 为 A[L 记 的 序列 所 构 
成 的 最 大 的 子 段 和 ,那么 递 推 关系 为 : 

Cli = max{Gli i+ALii i] At i= LD 
C[1]==A[1] 车 ALI] >0, 和 否则 C[1] 一 0 

这 里 还 有 一 个 问题 需要 解决 .刚才 定义 的 最 大 子 段 和 并 不 是 原始 问题 要 求 的 最 大 子 段 

和 . 怎样 从 这 些 结果 中 找到 原始 的 解 ? 首先 看 到 通过 这 一 系列 计算 ,得 到 了 C[1],C[2],…， 


AIm] 


最 大 子 段 和 Cli+1] | 
图 3.8 子 问题 归 约 
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C[z] ,恰好 枚 举 了 以 任何 元 素 为 最 后 元 素 的 所 有 子 段 的 最 大 和 . 显然 ,我 们 要 找 的 那个 具有 
最 大 和 的 子 段 一 定 在 里 面 . 只 要 对 n 个 和 进行 比较 ,一 定 可 以 找到 其 中 的 最 大 和 , 这 才 是 问 
题 所 要 求 的 最 大 和 . 比如 在 上 面 A 二 二 2, 一 5,8,11, 一 3,4,6 记 的 例子 中 ,所 要 求 的 最 大 和 是 
26 ,根据 上 面 设计 的 算法 ,我 们 会 求 出 C[1]==2,C[2]= 一 3,C[3]==8,C[4]==19,C[5]==16， 
CL6] 二 20,CL7] 二 26 这 7 个 值 . 通过 比较 ,找到 其 中 的 最 大 值 26, 它 正好 是 原 问题 的 优化 函 
数值 . 于 是 有 


OPT(4) = max{C[i]) 

这 里 的 OPT(A) 表 示 原 始 问 题 的 优化 函数 值 . 至 此 已 经 得 到 了 一 个 求解 最 大 子 段 和 的 动态 
规划 算法 ,算法 的 伪 码 给 在 下 面 . 

算法 3. 10 MaxSum(A,n) 

输入 : 数组 A 

输出 : 最 大 子 段 和 wm , 子 段 的 最 后 位 置 < 
.Sum<—0 
. b<0 //5 是 前 一 个 最 大 子 段 和 
. for i<l to n do 
if b=>0 
then 0<0 十 A[ 林 
else b<—A[i] 
if b> swum 
then sum<b 

coi // 记 录 最 大 和 的 末 项 标号 

10. return sum,c 

还 有 一 个 问题 需要 说 明 . 算法 的 输出 是 最 大 子 段 和 的 值 sum 和 子 段 的 最 后 位 置 , 子 段 
的 起 始 位 置 怎样 确定 呢 ? 这 还 需要 一 点 额外 的 工作 ,时 间 不 超过 O(n) ,请 读者 考虑 怎样 做 . 

最 后 让 我 们 看 看 这 个 算法 是 不 是 比分 治 算法 更 好 . 算法 3. 10 只 有 一 个 for 循环 ,执行 
次 数 为 0(m) ,循环 体内 部 是 常数 次 运算 ,因此 算法 MaxSum 的 时 间 复 杂 度 是 O(n). 此 外 ， 
找 子 段 和 的 起 始 位 置 的 工作 量 也 不 会 改变 整个 算法 的 时 间 复 杂 度 . 当然 ,这 个 例子 并 不 能 说 
明 对 任何 问题 动态 规划 算法 都 比分 治 算法 具有 更 高 的 效率 ,但 对 这 个 具体 问题 是 有 效 的 . 


3.3.6 最 优 二 分 检索 树 


在 计算 机 中 经 常 采用 二 叉 树 的 结构 来 存储 排 好 序 的 数据 , 称 为 二 分 检索 树 . 设 S= 
二 zi1,x2，"… ,Xs 记 是 被 排序 的 数据 集 ,其 中 zi 过 zs 二 … 二 xz,. 如 果 存 储 S 的 二 又 树 T 以 某 个 
Zi 作为 树 根 ,那么 zz ,x2，… ,zi_1 都 是 的 左 子 树 的 结 点 ,而 zini zits，… ,x 则 是 T 的 右 
子 树 的 结 点 .假设 == 二 1,2,3,4,5,6 放 ,图 3.9 中 的 树 就 是 一 棵 存储 S 的 二 又 树 ,其 中 辆 结 
点 代表 数据 结 点 , 方 结 点 Lo ,Li,… ,Ls。 代表 空隙 结 点 ,分 别 
表示 7 个 空 阶 ( 一 co,1),(152)502,3) .03,4),(4,5),(5,6) 
和 (6, 十 =). 在 这 棵 树 里 ,所 有 的 数据 结 点 都 是 内 结 点 .所 有 
的 空隙 结 点 都 是 树叶 . 设 x 是 给 定 整数 . 检索 从 z 与 树 根 的 
比较 开始 . 如 果 z 等 于 4, 则 检索 停止 ;如 果 比 4 小 , 则 进入 2| | 
左 子 树 , 与 4 的 左 儿子 2 进行 比较 ;如 果 比 4 大 , 则 进入 右 子 图 3.9 一 棵 二 叉 搜 索 树 
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树 , 与 4 的 右 儿子 6 进行 比较 . 如 此 递归 进行 下 去 . 如果 z 是 S 中 的 元 素 ,那么 算法 将 沿 着 从 
根 到 z 的 一 条 路 径 走 到 z 结 点 停止 . 如 果 z 不 是 S 中 的 元 素 , 那 么 算法 将 在 与 x 对 应 的 空 
隙 结 点 的 父 结 点 停止 . 比如 z==5, 在 图 3. 9 的 二 又 搜索 树 中 ,算法 将 xz 与 4 比较 ,x4, 于 是 
进入 右 子 树 ;下 一 步 与 6 比较 ,x 二 6, 于 是 进入 左 子 树 ; 第 三 步 把 x 与 5 比较 ,确认 找到 过 , 算 
法 停止 . 5 在 树 中 的 深度 (从 根 到 5 的 路 径 长 度 ) 是 2, 算 法 找到 5 的 比较 次 数 恰 好 是 2 十 1 一 
3. 如果 z 不 在 S 中 ,比如 z=1.3, 算 法 首先 把 x 与 4 比较 ,x 二 4, 于 是 进入 左 子 树 ;第 二 步 ， 
工 与 2 比较 ,x 还 是 比 2 小 ,算法 继续 进入 左 子 树 ; 第 三 步 ,z 与 1 比较 ,z>1. 算 法 应 该 进入 
右 子 树 . 但 是 右 子 树 只 有 空隙 结 点 Li (空隙 (1,2)) ,于 是 算法 停止 ,确认 z 不 在 S 中 ,算法 执 
行 的 比较 次 数 恰 好 是 Li 的 深度 . 因此 ,如 果 工 属于 S ,算法 执行 的 比较 次 数 就 是 二 在 树 中 的 
深度 加 1, 如 果 工 不 属于 S ,算法 执行 的 比较 次 数 就 是 zx 对 应 的 空隙 结 点 的 深度 . 
通过 上 面 的 分 析 可 以 知道 .算法 的 最 坏 情 况 对 应 了 二 分 检索 树 工 中 从 根 出 发 的 最 长 路 
径 , 因 此 树 的 深度 代表 了 算法 最 坏 情况 下 的 时 间 复 杂 度 . 比如 图 3. 9 的 二 叉 树 , 树 深 等 于 3， 
最 多 的 比较 次 数 也 是 3. 
平均 情况 的 比较 次 数 应 该 对 各 种 不 同 输入 进行 概率 平均 . 以 图 3. 9 的 二 叉 搜索 树 为 例 . 
假设 被 查找 的 z 等 于 1,2,3,4,5,6 的 概率 分 别 是 0.1,0.2,0.2,0.1,0.1,0.05;z 处 于 空隙 
Lo,Li,…,Ls 的 概率 分 别 是 :0. 04,0. 01,0.05,0. 02,0.02,0. 07,0. 04. 从 树 中 可 以 知道 ,如 
果 zz 一 1,3,5, 需 要 3 次 比较 ;如 果 Z= 一 2,6, 需 要 2 次 比较 ;如 果 Z=4, 只 需要 1 次 比较 .此 
外 ,zx 有 可 能 不 在 S 里 .zx 处 在 空 阶 Lo,Li,…,Ls ,需要 3 次 比较 ,处 在 空隙 Le 需要 2 次 比 
较 . 于 是 平均 比较 次 数 等 于 
[3x (0,.1 十 0.2 十 0.1) 十 2X (0.2 十 0.05) 十 1X0.1] 
十 [3X (0.04 十 0.01 十 0.05 十 0.02 十 0.02 十 0.07) 十 2 XX 0.04] 
= 1.8++0.71 = 2.51 
一 般 来 说 ,给 定 一 组 概率 分 布 ,可 以 构造 不 同 的 检索 树 ,它们 的 平均 比较 次 数 是 不 一 样 的 . 以 
上 面 的 概率 分 布 为 例 , 如 果 构 造 如 图 3. 10 所 示 的 另 一 棵 二 分 检 
索 树 ,那么 在 同样 的 输入 概率 分 布下 ,平均 比较 次 数 是 : 
EC WOLF KOT BO LO + T5001I 
十 [(1 Xx0.04 十 2X0.01 十 4X (0.05 十 0.02 十 0.04) 
-5X (0.07 十 0.02)] = 2.3 十 0.95 一 3.25 
所 谓 的 最 优 二 分 检索 树 就 是 : 在 给 定 存 取 概 率 分 布下 平均 
比较 次 数 最 少 的 二 分 检索 树 . 
最 优 二 分 检索 树 问 题 的 一 般 性 描述 见 例 3. 9. 
例 3.9 设 S$== 一 zz ,yz 二 是 数据 集 , 称 
(一 ceo,z)，Cziyze) Te La) (zy 十 co) 
为 第 0, 第 1,…, 第 nn 个 空 阶 , 分 别 记 作 Lo， Li，…,L,. 假设 xz 处 在 zx; 的 概率 是 4b;(i=1， 
2,…,n) ,处 在 第 j(j 二 0,1,2,…,) 个 空隙 的 概率 是 aj. 那么 与 S 相关 的 存 取 概 率 分 布 是 : 
P=<aobisa bs a bs brsas > 
TT 是 S 的 一 棵 二 分 检索 树 , 结 点 x; 在 工 中 的 深度 是 d (zi), i 一 1,2,…,n, 空 阶 上 ; 的 深度 为 
d (Lj) ,j= 二 0,1,…,n, 则 平均 比较 次 数 为 


图 3.10 不 同 结构 的 搜索 树 
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我 们 的 目标 是 : 给 定数 据 集 S 和 相关 存 取 概 率 分 布 尸 , 求 一 棵 最 优 的 , 即 平均 比较 次 数 最 少 
的 二 分 检索 树 . 

这 个 问题 的 蛮 力 算法 需要 枚 举 具 有 个 数据 结 点 的 所 有 二 分 检索 树 ,然后 从 中 找 出 最 
优 的 检索 树 . 利用 组 合 数 学 的 知识 可 以 证 明 , 与 矩阵 链 相 乘 的 问题 一 样 ,这 样 的 二 叉 树 的 数 


目 是 Catalan 数 : 
1 2n 了 22 
二 ]-o( 蕊 ) 


搜索 空间 太 大 ,这 样 的 算法 没有 实际 意义 . 

考虑 动态 规划 算法 . 取 定 树 根 以 后 ,原来 的 数据 集 S 被 划分 成 左 、 右 两 个 子 数据 集 , 因 
此 子 问题 需要 用 两 个 位 置 来 界定 . 令 S[i, 门 = 过 zi,zii，… ,zj 记 表 示 S 以 i 和 j 作为 边界 
的 子 数据 集 ,P[i, 门 二 二 ai_1,biwai,bi4，"… ,bj ,aj; 记 是 存 取 概率 分 布 P 对 应 于 SL[i, 门 的 部 
分 ,其 中 含有 j 一 i 十 1 个 数据 结 点 概率 ,还 有 j 一 i 十 2 个 空隙 结 点 的 概率 . 两 种 概率 交错 排 
列 , 头 和 尾 的 概率 都 是 空隙 结 点 的 概率 . 

假设 选 定 zx 作 根 ,k=i,i 十 1,…,j ,原来 的 S[i, 门 被 划分 成 SLi,k 一 1] 和 S[k 十 1,j] 两 
个 更 小 的 子 集 . 如 果 T[i, 站 是 一 棵 关于 S[i, 站 和 存 取 概 率 分 布 PLi, 门 的 一 棵 最 优 二 分 检索 
树 ,那么 T[i, 门 的 左 子 树 T[i,k 一 1] 是 关于 S[i,k 一 1] 和 P[i,k 一 1] 的 最 优 二 分 检索 树 , 同 
样 ,T[i, 门 的 右 子 树 T[k 十 1, 站 也 是 相对 于 S[k 十 1, 站 和 P[k 十 1, 站 的 最 优 二 分 检索 树 , 如 
若 不 然 ,假设 对 S[i,k 一 1] 和 P[i,k 一 1] 存 在 一 棵 更 优 的 二 分 检索 树 TT [i,k 一 1], 那么 用 它 
替换 T[i, 站 的 左 子 树 T[i,k 一 1], 就 会 得 到 一 棵 更 优 的 TT[i,j] 树 ,这 与 T[i, 门 树 的 最 优 性 
矛盾 . 对 于 右 子 树 也 可 以 同样 论证 . 这 正好 说 明 该 问题 满足 优化 原则 . 注意 ,在 k=i 的 情况 
下 , 子 问题 S[i,i 一 1] 不 含有 数据 .相对 应 的 概率 分 布 只 含有 1 个 空隙 概率 a;-1. 这 意味 着 所 
构造 的 子 树 只 含有 1 个 空隙 结 点 . 如 果 查 找 的 z+ 恰好 处 于 这 个 空 阶 , 那 么 它 将 在 与 其 父 结 点 
Zi 的 比较 中 被 确认 ,在 这 棵 子 树 内 不 需要 做 进一步 比较 ,于 是 对 应 于 该 子 树 的 平均 检索 次 
数 应 该 等 于 0. 同样 地 ,对 于 k=j 的 情况 也 有 类 似 的 结果 . 这 两 种 情况 都 对 应 于 空 数据 集 的 
最 小 子 问题 ,相应 的 优化 函数 的 递 推 关系 在 这 里 取得 初 值 . 即 当 问题 规模 为 0( 含 0 个 数据 
结 点 的 子 问 题 ) 时 ,比较 次 数 等 于 0. 

下 面 考虑 如 何 建立 子 问题 之 间 的 弟 推 美 系 . 设 m[i, 门 是 相对 于 输入 S[i,j 站 和 P[i,j] 
的 最 优 二 分 检索 树 的 平均 比较 次 数 , 令 


wLisyj = as 十 > 
是 ,P[ 宗 与 空 阶 的 ) 之 和 . 考虑 以 Zh 为 根 的 最 优 二 分 检索 树 ， 
其 中 ==i,i 十 1,…,j, 它 的 左 子 树 T[i,k 一 1] 和 布 子 树 T[k 十 1, 站 的 最 优 平均 比较 次 数 分 别 
是 m[i,k 一 1 和 m[k 十 1,j]. 当 把 这 两 棵 子 树 的 根 分 别 作 为 x 的 左 、 右 儿子 组 合成 一 棵 二 
叉 树 T[i,j] 时 ,原来 子 树 中 每 个 结 点 的 深度 在 T[i,j] 中 都 加 1, 于 是 每 棵 子 树 的 平均 比较 
次 数 将 增加 1. 但 是 相对 于 原始 问题 , 即 树 T[1.nj 来 说 ,对 总 平均 比较 次 数 的 增加 值 应 该 等 
于 1 乘 以 该 子 树 的 概率 , 即 该 子 树 的 概率 .于 是 ,在 树 T[i, 站 中 , 左 子 树 和 右 子 树 对 平均 比 
较 次 数 的 贡献 分 别 是 : 
mLisk—1]+wLisk 一 1] 和 m[k 十 1,jj 十 w[Lk 十 1,j] 
而 根 zx 在 第 0 层 ,比较 次 数 是 1, 它 的 存 取 概率 是 b ,把 所 有 这 些 都 加 起 来 就 是 树 T[i, 门 的 
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平均 比较 次 数 . 令 m[i,jj 表示 根 为 ze 时 的 二 分 检索 树 平均 比较 次 数 的 最 小 值 ,那么 有 如 
下 公式 : 
ml[isjls =(Cm[Lisk—1]+wLisk—1])+ (Gm[k 二 1,7] 二 wk 十 1,7]) 十 1 Xb 
二 (m[isk 一 1 十 m[k 十 1.7]) 十 (vw[isk 一 1]| 十 Bi 十 wlk 十 1,7]) 


kl kl i i 
=Cm[isk—1]+m[k+1 iD)+ (2 ast D6)tht (at 276) 
g=i pk 9 一 对 1 


jp 一 二 1 


本 
=(m[isk—1]+m[kt+1,j)+ >) ao 十 >)0。 


二 m[isk 一 1] 十 m[k 十 1,7] 十 w[Li,j] 
上 述 公 式 是 根 在 z 情况 下 的 最 小 值 . 问题 的 解 所 要 求 的 最 少 平均 比较 次 数 需要 考虑 在 所 有 
& 的 情况 下 m[i,jj; 的 最 小 值 , 即 
m[i;j] = min{m[isjj | i<k<)) 

在 找到 最 小 值 m[i, 站 的 同时 需要 标记 得 到 这 个 最 小 值 的 & 是 什么 ,以 便 追 踪 问 题 的 解 . 

下 面 考虑 m[i, 门 的 初 值 . 根据 前 面 对 于 子 问 题 边 界 的 界定 ,每 个 子 问 题 含 有 的 空隙 结 
点 概率 恰好 比 数据 结 点 的 概率 多 1 个 ,而 且 边 界 处 的 概率 都 是 对 应 于 空隙 结 点 的 概率 . 最 小 
的 子 问题 是 只 含 1 个 空隙 结 点 的 子 问题 ,这 种 情况 对 应 于 =i 时 的 左 子 树 和 ==j 时 的 右 
子 树 . 根据 上 面 的 分 析 , 有 弟 推 关系 如 下 : 

m[isjj = mintmLisk—1]+m[k+1,j] +wLi,j]}, l1<i<j<<n 


m[isi—1]=0, i= 1,2,%,n 
其 中 mm[i,i 一 1] 恰 好 对 应 不 含 数据 结 点 ,平均 比较 次 数 等 于 0 的 子 问题 . 
这 个 问题 的 伪 码 描述 与 矩阵 链 相 乘 类 似 , 实 现 方法 采用 和 迭代 方法 ,限于 篇 幅 此 处 不 再 歼 
述 .算法 的 时 间 是 Ow ) ,因为 问题 边界 i.j 的 取 值 都 是 O(n), 所 有 子 问题 的 个 数 是 O(n?) 
个 ,而 对 每 个 子 问题 需要 对 树 根 位 置 k 进行 选择 ,这 也 是 O(n). 
最 后 用 一 个 小 例子 来 说 明 算法 的 计算 过 程 . 给 定 输入 
S=<=A,B,C,D,E> 
P==0.04,0.1,0.02,0.3,0.02,0.1;0.05,0.2,0.06,0.1,0.01> 
其 中 带 下 划 线 的 是 数据 结 点 A. B, C, D, EF 的 存 取 概率 ,不 带 下 划 线 的 是 空 际 结 点 的 存 取 
概率 . 算法 先 计 算 规 模 为 1, 即 含有 一 个 数据 结 点 的 子 问题 . 计算 结果 是 : 
mn[1,1] 三 :0.16， wm[252] = 0.34, mL3;3] = 0;17, 
m4 = 0.31 wmL55]=017 

第 二 步 计算 规模 为 2 的 子 问题 . 

m[1,2] = min{m[2,2], m[1,1]}++0.48 = 0.64 k=2 

m[2,3] = min{m[3,3], m[2,2]} 十 0.49 = 二 0.66 & 一 2 

m[3,4] = min(m[4,4], sn[3;53]} 二 0.43=0.60 k=4 

m[4,5] = min{m[5,5], m[4,4]}++0.42 = 0.59 
第 三 步 计算 规模 为 3 的 子 问题 . 

m[1,3] = min{m[2,3], m[1,1] 二 m[3,3], m[1,2]} 十 0.63 二 0.96 k=2 
m[2,4] = min{m[3,4], mL2,2] 二 mL4,4], mL[2,3]} 二 0.75=1.35 k=2 
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m[3,5] = min{m[4,5], m[3,3j] 二 m[5,5], m[3,4]} 十 0.54 = 二 0.88 k=4 
第 四 步 计算 规模 为 4 的 子 问 题 . 
m[1,4] = min{m[2,4],m[1,1] 二 +m[3,4],m[1,2]+m[4,4],m[1,3]} 十 0.89 = 1.65 
k=2 
m[2,5] = min{m[3,5],m[2,2j] 二 m[4,5],m[2,3] 十 m[5,5],m[2,4]} 十 0.86 一 1.69 
k=4 
最 后 一 步 , 计 算 规模 为 5 的 问题 ,也 是 原始 问题 . 
m[1,5] = min{m[2,5],m[1,1]+m[L3,5],m[1,2] +m[4,5], 
m[1,3] 十 m[5,5],m[1,4]} 十 1 = 2.04 & 一 2 
于 是 得 到 最 优 二 又 搜索 树 的 平均 比较 次 数 是 2. 04. 
从 后 向 前 追踪 解 ,最 后 一 次 计算 的 k= 二 2, 说 明 
树 根 是 B, 那么 左 子 树 只 能 是 A, 右 子 树 对 应 于 输 
入 S[3,5]== 二 C,D,E 放 ,看 到 计算 m[3,5] 的 时 候 
k 二 4, 于 是 D 是 右 子 树 的 根 ,C 和 EE 分别 是 DD 的 左 
和 右 儿 子 . 这 棵 树 的 结构 如 图 3. 11 所 示 . 在 这 个 图 
图 3.11 解 的 追踪 结果 中 ,可 以 按照 定义 计算 平均 比较 次 数 . 令 结 点 i 的 深 
度 是 4 (i) ,那么 将 得 到 ， 


5 5 
t= Db(d(z) + D+ ad[L;] 
证 1 j=0 


[o.1X2 十 0.3X1 十 0.1X3 十 0.2X2 十 0.1X3] 
上 [0.04 X2 十 0.02X2 十 0.02X3 十 0.05X3 十 0.06X3 十 0.01X3] 
一 1.5 十 0.54 一 2.04 
不 难看 出 这 个 结果 与 动态 规划 算法 的 结果 是 完全 一 样 的 . 


3.3.7 生物 信息 学 中 的 动态 规划 算法 


动态 规划 算法 在 生物 信息 学 中 也 有 许多 应 用 . 比如 序列 比 对 .RNA 二 级 结构 预测 等 . 下 
面 简单 介绍 一 下 RNA 二 级 结构 预测 问题 . 

RNA 分 子 的 一 级 结构 可 以 看 作 是 由 核 苷 酸 顺 序 排列 构成 的 一 条 链 . 由 于 含有 碱 基 不 
同 ,这 些 核 苷 酸 分 别 标记 为 字母 A,C,G.U. 由 于 相互 作用 , 碱 基 可 以 互补 配对 构成 平面 结 
构 . 图 3. 12 所 示 就 是 一 个 4s RNA 分 子 的 二 级 结构 (个别 位 置 出 现 核 苷 酸 变异 ,用 工 表 
示 ). 其 中 连续 配对 的 区 域 称 为 “ 臂 ”, 只 与 一 个 臂 连接 的 环 称 为 “发 夹 环 ”, 与 多 个 臂 连 接 的 环 
称 为 “内 环 ” 图 中 的 二 级 结构 中 含有 4 个 发 夹 环 .1 个 内 环 和 5 个 臂 . 如 果 把 核 苷 酸 的 位 置 
依次 记 作 1,2,….n, 那 么 构成 二 级 结构 时 要 遵循 以 下 规则 : 

(1) 配对 只 在 U 与 A,C 与 G 之 间 进 行 . 

(2) 在 发 夹 环 部 位 不 允许 出 现 “ 尖 角 ”, 至 少 含有 3 个 不 参与 匹配 的 核 背 酸 ; 换 句 话 说 ， 
如 果 位 置 i 与 7 配对 ,那么 i<j 一 4. 

(3) 每 个 核 苷 酸 只 能 参加 一 个 配对 . 

(4) 不 允许 交叉 配对 , 即 如 果 4 个 碱 基 位 置 ,is; 记 .js 满足 神 二 is 二 放 二 js ,那么 不 允 
许 二 一 广 ,iz 一 jz 配对 .但 可 以 允许 一 jz ,siz 一 志 配对 . 
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图 3.12 一 个 4s RNA 的 二 级 结构 


给 定 RNA 一 级 结构 .按照 上 述 原 则 可 能 得 到 多 个 不 同 的 二 级 结构 ,具有 最 小 自由 能 的 
结构 是 稳定 结构 . 把 这 个 问题 简化 ,只 考虑 配对 的 对 数 , 那 么 可 以 如 下 建 模 为 组 合 优 化 问题 . 

例 3.10 ”给 定 由 字符 A,C.G,U 构成 的 长 为 n 的 链 , 在 满足 上 述 配 对 规则 的 前 提 下 , 求 
具有 最 大 匹配 数目 的 配对 方案 . 

考虑 动态 规划 算法 . 首先 设 定子 问题 的 边界 . 子 问 题 应 该 由 i 和 j 来 界定 ,其 中 i<j. 令 
S[1..n]j 表 示 输 入 序列 ,那么 S[i.. 门 是 子 序列 ,对 应 一 个 规模 为 j 一 i 十 1 的 子 问题 . 如 图 3. 13 
所 示 ,如果 j 参与 配对 ,比如 j 与 & 配对 (根据 没有 尖 角 的 原则 .1 三 & 志 j 一 4) ,根据 不 交叉 原 
则 , 剩 下 的 问题 归 约 为 S[i..& 一 1] 和 S[k 十 1..j 一 1] 两 个 子 序列 的 配对 问题 . 如 果 j 不 参与 
配对 ,那么 剩 下 的 是 S[i..j 一 1] 的 子 问 题 . 


二 志 0 0 o 
i tl kl k k+l 1j 


图 3.13 子 问 题 的 归 约 


不 难看 到 ,这 个 问题 满足 优化 原则 . 设 CLi, 站 是 序列 S[i..j] 的 最 大 配对 数目 , 递 推 关 系 
如 下 : 

CLi,jj] = max{C[Li,j—1], max, {1 + CLi,k—1]+CLk+1,;— 1]}}, j 一 i 宇 4 

(© Eo | 

这 里 不 再 给 出 算法 的 伪 码 . 因为 不 同 的 子 问题 个 数 是 i 与 j 的 组 合 数 ,应 该 是 O(n?) 个 . 
对 于 每 个 子 问题 的 计算 ,依赖 于 的 选择 ,应 该 是 O(n) 个 ,于 是 算法 时 间 复 杂 度 是 On). 

在 生物 信息 学 中 经 常 需 要 对 序列 进行 比较 .看 看 它们 究 竞 有 多 相似 . 下 面 考虑 两 个 序列 
的 编辑 距离 . 
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例 3.11 给 定 两 个 序列 S 和 S$: ,通过 一 系列 字符 编辑 (插入 、 删 除 、 蔡 换 ) 操 作 , 将 Si 
转变 成 S:. 完成 这 种 转换 所 需要 的 最 少 的 编辑 操作 个 数 称 为 S; 和 S; 的 编辑 距离 . 
例如 把 vintner 转变 成 writers, 可 以 通过 以 下 编辑 操作 完成 : 
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删除 v: - intner 

插入 w: wintner 

插入 r: wrintner 

删除 n: wri- tner 

删除 n: writ- er 

插入 s: writers 
因此 编辑 距离 小 于 等 于 6. 

使 用 动态 规划 算法 求解 这 个 问题 . 先 考 虑 子 问题 划分 . 与 求 序列 最 长 公共 子 序列 类 似 ， 
设 Si[1.. 让 和 Ss[1.. 站 表示 两 个 子 序 列 ,C[i,j] 表 示 Si[1.. 和 S:[1.. 门 的 编辑 距离 . 考虑 最 
后 一 对 字符 S1[ 门 与 S[ 站 ,如 果 Si[ 门 被 删除 ,那么 编辑 距离 是 Si[1..i 一 1] 和 Ss[1.. 门 的 编 
辑 距离 加 1; 如 果 在 S1[ 门 后 面 插 入 Ss[j] ,那么 编辑 距离 是 Si[1.. 门 和 Ss[1..; 一 1] 的 编辑 距 
离 加 1; 如 果 Si[ 疏 被 替换 成 S;[ ,那么 编辑 距离 是 Si[1..i 一 1 与 S:[1..j 一 1] 的 编辑 距离 
加 1; 如 果 Si[ 亲 =S;[ 门 ,那么 编辑 距离 是 S1[1..i 一 1 与 S$;[1..j 一 1j 的 编辑 距离 . 递 推 关系 
如 下 : 


CLid] =minteL = = eli=hy= 了 J 二; 
让 室 轴 := hi 0 要 ee oy en 
C[0,j] =j, j= 1,2,.…,m 
C[i,0] =i, i= 1,2,°,n 
算法 的 时 间 复 杂 度 是 O(nm) ,其 中 和 mm 分别 是 序列 S， 和 S, 的 长 度 . 
更 复杂 的 编辑 距离 问题 是 带 权 的 编辑 距离 问题 ,可 以 对 每 个 编辑 操作 赋予 不 同 的 权 值 ， 
问题 的 目标 是 求 具 有 最 小 权 的 转换 操作 序列 . 
例 3.12 序列 比 对 . 
设 Si[1..n] 和 Ss[1..mj 是 两 个 序列 ,把 它们 并 排放 到 一 起 进行 比较 ,在 比较 时 可 以 在 
某 个 序列 的 字符 之 间 插 入 空格 .插入 空格 的 目的 是 使 它们 局 部 的 相同 区 域 能 够 对 应 . 如 果 两 
个 对 应 字符 相等 ,那么 赋 权 值 2; 如 果 对 应 字符 不 等 , 赋 权 值 一 2; 如 果 一 个 是 字符 ,一 个 是 空 
格 , 赋 权 值 一 1. 我 们 的 目标 是 寻找 权 值 最 大 的 对 准 方式 . 比如 序列 是 axabcdes 和 axbacfes， 
那么 下 面 就 是 两 个 比 对 : 


axab=-edes ax-abcdes 
ax-bacfes axba-cfes 
其 中 对 准 的 字符 个 数 都 是 6; 字 符 不 等 的 是 d 和 f; 还 有 两 个 空格 .于 是 这 两 个 比 对 的 权 是 : 
x2 二 《一 荡 牛 26 C= 二 8 
假设 CLi,j] 表 示 序 列 Si,L1..i] 与 $;[1..7 比 对 的 最 大 权 值 . 如 果 在 比 对 中 把 Si [i 与 
Sz[j] 对 准 , 那 么 当 Si[ 疏 ==Ss[jj 时 ,问题 归 约 为 S1[1..i 一 1] 与 S:[1..j 一 1j 的 比 对 ,其 权 值 
等 于 C[i 一 1,j 一 1 十 2; 当 Si[ 让 了 关 S:[jj 时 ,问题 仍旧 归 约 为 S1[1..i 一 1] 与 Si:[1..j 一 1] 的 比 
对 ,其 权 值 等 于 CLi 一 1,j 一 1] 一 2. 如 果 Si[ 可 与 S:[j] 没 对 准 , 其 中 需要 增加 一 个 空格 ,那么 
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问题 将 归结 为 Si[1..i 一 1] 与 Sz[1.. 门 的 比 对 或 者 Si[L1.. 可 与 S;[1..j 一 1] 的 比 对 ,其 权 值 应 
该 等 于 子 问题 的 权 一 1. 于 是 得 到 弟 推 方程 : 

Ci)] = maxt0 ,EG =17= 直 SSG DC = =1 G0 =1] =1) 
其 中 


2(S1[i],S2[Lj]) = - 2 2 rR 
CL0,j] =0 j= 1,2,,m 
CLi,0] =0 让 一 12， 元 

与 编辑 距离 类 似 ,算法 的 时 间 复 杂 度 是 O(zzz). 

本 章 介 绍 了 动态 规划 算法 .这 是 求解 多 阶段 决策 (优化 ) 问 题 的 一 种 通用 算法 设计 技术 . 
动态 规划 算法 的 正确 性 基础 是 优化 问题 的 最 优 子 结构 性 质 , 也 就 是 优化 原则 , 即 : 一 个 最 优 
决策 序列 的 任何 子 序 列 本 身 一 定 是 相对 于 子 序 列 的 初始 和 结束 状态 的 最 优 的 决策 序列 . 利 
用 这 个 性 质 可 以 在 计算 中 充分 利用 较 小 的 最 优 子 结构 来 组 合 较 大 的 最 优 子 结构 ,从 底 向 上 
逐步 求解 ,直到 得 出 原始 问题 的 解 为 止 . 

动态 规划 算法 的 设计 要 素 是 

(1) 引入 参数 来 界定 子 问 题 的 边界 . 如 果 只 有 一 种 类 型 的 变量 ,最 简单 的 可 以 采用 下 述 
方法 : 所 有 的 子 问题 都 从 同一 个 起 始 位 置 .比如 1 开始 ,然后 用 i 标定 子 问 题 的 结束 位 置 ， 
i 二 1,2,…,n. 稍微 复杂 一 些 的 需要 前 后 两 个 边界 : 起 始 位 置 ; 和 结束 位 置 ) ， 比 如 和 矩阵 链 相 
乘 问题 . 有 的 问题 涉及 两 种 类 型 的 变量 ,比如 允许 背包 使 用 的 最 大 物品 标号 和 背包 重量 限 
制 , 这 就 涉及 具有 两 类 参数 的 子 问 题 . 

(2) 判断 该 优化 问题 是 否 满足 优化 原则 . 

(3) 注意 子 问题 的 重 全 程度 . 如 果子 问题 的 重 倒 程度 较 低 , 使 用 动态 规划 算法 很 难 比 蛮 
力 算法 在 时 间 复 杂 度 上 得 到 实质 改进 . 

(4) 分 析 子 问题 之 间 依 赖 关 系 . 给 出 带 边 界 参数 的 优化 函数 定义 , 尽 可 能 简化 优化 函数 
值 从 较 大 子 问题 到 较 小 子 问 题 归 约 的 递 推 关系 .同时 考虑 标记 函数 . 找到 递 推 关系 的 边界 条 
件 , 即 最 小 子 问题 的 优化 函数 值 . 

(5) 采用 自 底 向 上 的 实现 技术 ,从 最 小 的 子 问 题 开 始 和 迭代 计算 ,直到 原始 问题 规模 为 
止 . 计算 中 用 备忘录 保留 优化 函数 和 标记 函数 的 值 . 

(6) 利用 备忘录 和 标记 函数 通过 追溯 得 到 最 优 解 . 

(7) 动态 规划 算法 的 时 间 复 杂 度 与 子 问题 个 数 以 及 每 个 子 问题 计算 的 工作 量 相关 . 估 
计 工 作 量 的 基本 方法 就 是 对 所 有 子 问题 的 计算 工作 量 求 和 . 

(8) 由 于 需要 备忘录 来 存放 中 间 结 果 ,动态 规划 算法 一 般 使 用 较 多 的 存储 空间 ,对 于 某 
些 规模 较 大 的 问题 ,这 往往 成 为 限制 动态 规划 算法 使 用 的 瓶颈 因素 . 


习 题 3 
对 于 本 章 与 算法 设计 有 关 的 习题 , 解 题 要 求 如 下 : 必须 对 优化 函数 和 标记 函数 的 含义 


给 出 说 明 , 列 出 子 问题 计算 中 所 使 用 关于 优化 函数 及 标记 函数 的 递 推 关系 和 初 值 . 根据 题目 
要 求 给 出 迭代 实现 的 伪 码 并 估计 算法 的 复杂 度 . 如 果 题 目 给 出 具体 的 输入 实例 ,应 该 根据 给 
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定 实例 进行 计算 并 给 出 相关 的 备忘录 表 和 最 后 的 解 . 


$1 


3.3 


用 动态 规划 算法 求解 下 面 的 组 合 优 化 问题 : 
max gi1(X1) + gs (x2) + ga (Xx) 
0] 
Zi1,T2 ,3 为 非 负 整数 

其 中 函数 gl Cz)，8g:(Cz)，sgs(Cz) 的 值 给 在 表 3. 9 中 . 


表 3.9 函数 值 
落 SI(CZ) g2 (XT) ga3(Xx) 3 g1(7) g2 (7) g3(7) 
0 2 5 8 2 7 16 17 
4 10 12 3 11 20 22 


设 A= 达 ,zs，…,z, 记 是 nn 个 不 等 的 整数 构成 的 序列 ,A 的 一 个 单调 递增 子 序列 是 
序列 二 zs 9 二 使 得 i 县 2 < ER 要 子 序列 过 xz FT 
Zi 的 长 度 是 含有 的 整数 个 数 . 例如 A= 二 1,5,3,8,10,6,4,9 二 , 它 的 长 为 4 的 递 
增 子 序列 是 : 二 1,5,8,10>> ,一 1,5,8,9 二 ,…. 设 计 一 个 算法 求 A 的 一 个 最 长 的 单调 
递增 子 序列 ,分 析 算 法 的 时 间 复 杂 度 . 设 算法 的 输入 实例 是 A 一 一 2,8,4, 一 4,5,9， 
11 二 ,给 出 算法 的 计算 过 程 和 最 后 的 解 . 

及 n 个 底面 为 长 方形 的 货柜 需要 租用 库房 存放 . 如 果 每 个 货柜 都 必须 放 在 地 面 上 , 且 
所 有 货柜 的 底面 宽度 都 等 于 库房 的 宽度 .那么 第 i 个 货柜 占用 库房 面积 大 小 只 需要 用 


它 的 底面 长 度 4 来 表示 ,i 一 1， 2,…,n. 设 库房 总 长 度 是 D(1 之 D 且 /> D). 设 
i=1 


第 i 号 货柜 的 仓储 收益 是 v;, 若 要 求 库房 出 租 的 收益 达到 最 大 , 问 如 何 选择 放 入 库房 
的 货柜 ?车 44,1，,… ,4,D 都 是 正 整数 ,设计 一 个 算法 求解 这 个 问题 ,给 出 算法 的 伪 码 
描述 并 估计 算法 最 坏 情况 下 的 时 间 复 杂 度 . 
设 有 ?项 任务 ,加工 时间 分 别 表示 为 正 整数 ez,… 心 : 现 有 2 台 同 样 的 机 器 ,从 0 时 
刻 可 以 安排 对 这 些 任 务 的 加 工 . 规定 只 要 有 待 加 工 的 任务 ,任何 机 器 就 不 得 闲置 . 如 果 
直到 时 刻 工 所 有 任务 都 完成 了 ,总 的 加 工时 间 就 等 于 T. 设计 一 个 算法 找到 使 得 总 加 
工时 间 工 达到 最 小 的 调度 方案 . 设 给 定 实例 如 下 : 

ti ls 法 5 济 2 面 10， ts 3 
试 给 出 一 个 加 工时 间 最 少 的 调度 方案 . 给 出 计算 过 程 和 问题 的 解 . 
设 有 种 不 同 面值 的 硬币 ,第 i 种 硬币 的 币值 是 vi (其 中 vi 一 1), 重 量 是 w; ,i 二 1， 
2,…,n 且 现在 购买 总 价值 为 y 的 某 些 商 品 ,需要 用 这 些 硬币 付款 ,如 果 每 种 钱币 使 用 
的 个 数 不 限 , 问 如 何 选择 付款 的 方法 使 得 付出 钱币 的 总 重量 最 轻 ? 设计 一 个 求解 该 问 
题 的 算法 .给 出 算法 的 伪 码 描述 并 分 析 算 法 的 时 间 复 杂 度 . 假设 问题 的 输入 实例 是 : 


UL ls ws 4， vs 6, 友 8 
Tw 1， zz 2， zs 4， vw 6 
y= 12 


给 出 算法 在 该 实例 上 计算 的 备忘录 表 和 标记 函数 表 , 并 说 明 付 钱 的 方法 . 
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3.6 


3. 10 


3 


nn 种 币值 x， zxs,，… ,zx 和 总 钱 数 M 都 是 正 整 数 . 如 果 每 种 币值 的 钱币 至 多 使 用 1 
次 , 问 :对 于 M 是 否 可 以 有 一 种 找 零钱 的 方法 ? 设计 一 个 算法 求解 上 述 问题 . 说 明 算 
法 的 设计 思想 ,分 析 算 法 最 坏 情况 下 的 时 间 复 杂 度 . 

在 一 条 呈 直 线 的 公路 两 旁 有 个 位 置 zi，z， … ，z 可 以 开 商 店 ,在 位 置 x; 开 商 店 
的 预期 收益 是 Pi 一 1,2,…,2， 如 果 任 何 两 个 商店 之 间 的 距离 必须 至 少 为 d 千 米 ， 
那么 如 何 选择 开设 商店 的 位 置 使 得 总 收益 达到 最 大 ? 

(1) 用 组 合 最 优化 方法 对 该 问题 建 模 , 写 出 目标 函数 与 约束 条 件 . 

(2) 设计 一 个 算法 求解 该 问题 ,说 明 算 法 设计 思想 ,分 析 算法 最 坏 情况 下 的 时 间 复 


杂 度 . 


设 A={al,as，…,a,) 是 正 整 数 的 集合 ， D3 一 N, 设计 一 个 算法 判断 是 否 能 够 把 


A 划分 成 两 个 子 集 A 和 A, .使 得 A, 中 的 数 之 和 与 A, 中 的 数 之 和 相等 ? 说 明 算 法 的 
设计 思想 ,估计 算法 最 坏 情 况 下 的 时 间 复 杂 度 . 
有 nn 项 作业 的 集合 本 二 {1,2,…,n}) ,每 项 作业 i 有 加 工时 间 1 (EZ? ,1(1)<1(2) 寺 … 
三 t(n) ,效益 值 w(i) ,任务 的 结束 时 间 DE Zt ,其 中 Z+ 表示 正 整 数 集合 . 一 个 可 行 调 
度 是 对 JJ 的 子 集 A 中 任务 的 一 种 安排 ,对 于 i€ A,f/( 引 是 开始 时 间 , 且 满足 下 述 条 件 : 
7 十 iD 二 GO) 或 者 GO)+TiOD) 委 GD，7 关 1 ijJEA 
20 SE 
kEA 
设 机 器 从 0 时 刻 开动 ,只 要 有 作业 就 不 闲置 , 求 具有 最 大 总 效益 的 调度 . 给 出 算法 的 伪 
码 , 分 析 算 法 的 时 间 复 杂 度 . 
把 0-1 背包 问题 加 以 推广 . 设 有 种 物品 ,第 i 种 物品 的 价值 是 v;, 重量 是 zw, 体积 
是 c;, 且 装 和 背包 的 重量 限制 是 W ,体积 是 V. 问 如 何 选择 装 和 背包 的 物品 使 得 其 总 
重 不 超过 太 ,总 体积 不 超过 V 且 价 值 达到 最 大 ? 设计 一 个 动态 规划 算法 求解 这 个 问 
题 , 说 明 算法 的 时 间 复 杂 度 . 
有 个 分 别 排 好 序 的 整数 数组 Au ,A; ,…,A，; ,其 中 A; 含有 zx; 个 整数 ,i 二 0,1,…， 
7 一 1. 已 知 这 些 数组 顺序 存放 在 一 个 圆 环 上 ,现在 要 将 这 些 数组 合并 成 一 个 排 好 序 
的 大 数组 , 且 每 次 只 能 把 两 个 在 圆 环 上 处 于 相 邻 位 置 的 数组 合并 . 问 如 何 选择 这 "一 
1 次 合并 的 次 序 以 使 得 合并 时 总 的 比较 次 数 达到 最 少 ? 设计 一 个 动态 规划 算法 求解 
这 个 问题 ,说 明 算法 的 时 间 复 杂 度 . 
设 A 是 顶点 为 1,2,…,n 的 凸 多 边 形 ,可 以 用 不 在 内 部 相交 的 n 一 3 条 对 角 线 将 A 划 
分 成 三 角形 ,图 3. 14 就 是 5 边 形 的 所 有 的 划分 方案 . 假设 凸 n 边 形 的 边 及 对 角 线 的 
长 度 d; 都 是 给 定 的 正 整数 ,1 过 i 二 j 志 n. 划分 后 三 角形 ijk 的 权 值 等 于 其 周 长 , 求 具 
有 最 小 权 值 的 划分 方案 . 设计 一 个 动态 规划 算法 求解 这 个 问题 ,说 明 算法 的 时 间 复 


NOQQODQ 


图 3.14 5 边 形 的 划分 方案 
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图 的 连通 性 问题 是 图 论 研究 的 重要 问题 之 一 ,在 实际 中 有 着 广泛 的 应 用 . 例如 通信 网 
络 的 连通 问题 ,运输 路 线 的 规划 问题 ,等 等 . 一 个 著名 的 检查 图 的 连通 性 的 算法 就 是 
Warshall 算法 . 假设 D== 二 V,E 二 是 顶点 集 为 V 二 {zi ,xs，… ,Xx,), 边 集 为 巨 的 有 向 
图 .nXn 的 0-1 和 矩阵 M=(rs) 是 DD 的 矩阵 表示 . 考虑 十 1 个 矩阵 构成 的 序列 Mo， 
MM ,…,M, ,将 矩阵 Ms 的 i 行列 的 元 素 记 作 M4[i,jj. 对 于 k=0,1,*…,n,Mi[i,jj==1 
当 且 仅 当 在 图 中 存在 一 条 从 xz; 到 zh 的 路 径 , 并 且 这 条 路 径 除 端点 外 中 间 只 经 过 
{zisz2，"…* ,Xk) 中 的 顶点 .不 难看 出 Mo 就 是 M, 而 在 M, 中 如 果 M[i, 门 二 1, 则 说 明 
DD 中 zx; 与 x; 是 连通 的 . Warshall 算法 从 Mo 开始 ,顺序 计算 Mi ,M: ,… ,直到 M, 为 
止 . 利用 动态 规划 的 迭代 实现 方法 来 实现 Warshall 算法 ,给 出 算法 的 伪 码 表示 并 
分 析 算 法 的 时 间 复 杂 度 . 假设 某 有 向 网 络 的 结 点 是 4a, 0. c, d, 已 知 网 络 的 矩阵 表 
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示 是 : 
人 
|。 全 和 而 
M= 
EE 仿 0 各 
(ok kt.) 


给 出 算法 在 这 个 实例 的 计算 过 程 和 结果 . 
考虑 3. 3.7 节 中 提 到 的 带 权 编辑 距离 问题 . 设 Si[1..n] 和 Ss[1..m] 表 示 两 个 序列 , 假 
设 插入 和 删除 操作 的 权 是 ,替换 操作 的 权 是 x. 令 C[i, 门 表示 序列 Si[1..i] 和 
Ss[1..7] 的 最 小 权 编 辑 距 离 , 设计 一 个 算法 求解 该 问题 ,给 出 关于 C[Li,j 的 递 推 关 
系 并 分 析 算 法 的 时 间 复 杂 度 . 
某 机 器 每 天 接受 大 量 加 工 任务 ,第 ;天 需要 加 工 的 任务 数 是 zi, 随 着 机 器 连续 运行 时 
间 的 增加 ,处 理 能 力 越 来 越 低 ,需要 花 1 天 时 间 对 机 器 进行 检修 ,以 提高 处 理 能 力 . 检 
修 当 天 必须 停工 ,重启 后 的 第 i 天 能 够 加 工 的 任务 数 是 ;;, 且 满足 

We 呈 0 
我 们 的 问题 是 : 给 定 zz ze 和 si 如何 安排 机 器 的 检修 时 间 , 以 使 得 
在 n 天 内 加 工 的 任务 数 达 到 最 大 ? 设计 一 个 算法 求解 该 问题 . 
设 忆 是 一 台 Internet 上 的 Web 服务 器 .T= {1,2,…,n}) 是 n 个 下 载 请 求 的 集合 ， 
ViET,awE2Z+ 表 示 下 载 请 求 了 所 申请 的 带宽 .已 知 服务 器 的 最 大 带宽 是 正 整 数 KK. 


我 们 的 目标 是 使 带宽 得 到 最 大 限度 的 利用 , 即 确定 了 的 一 个 子 集 S ,使 得 >)a; 过 
iES 
K, 有 LK— Ze 的 值 达到 最 小 . 设计 一 个 算法 求解 服务 器 下 载 问题 ,用 文字 说 明 算法 


的 主要 设计 思想 和 步 又 .名 给 出 最 坏 情况 下 的 时 间 复 杂 度 
有 正 实数 构成 的 数字 三 角形 排列 形式 如 图 3. 15 所 示 . 第 一 行 的 数 为 au; 第 二 行 的 数 
从 左 到 右 依 次 为 aa .azs;… 第 nn 行 的 数 为 am aw，… am 从 


an 开 始 ,每 一 行 的 数 ui 只 有 两 条 边 可 以 分 别 通 向 下 一 行 的 两 中 四 
个 数 auroy 和 aeroborb， 请 设计 一 个 算法 ,计算 出 从 aa 通 到 1 2 0 
am am ，… ,am 中 菜 个 数 的 一 条 路 径 , 并 且 使 得 该 路 径 上 的 数 ml me … am 


之 和 达到 最 小 . 图 3.15 数字 三 角形 
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3.18 ” 设 集 合 A 二 {a,6b,c} ,A 中 元 素 的 运算 满足 4a 一 ab 二 bb 二 b,ac 二 bc 二 ca 二 a ,ba 二 cb 
cc 一 c. 给 定 n 个 A 中 字符 组 成 的 串 xz1xs…zx, ,设计 一 个 算法 ,检查 是 否 存 在 一 种 运 
算 顺 序 使 得 这 个 串 的 运算 结果 等 于 a. 如 果 存 在 , 则 回答 “1”, 和 否则 回答 “0”. 例如 串 
Z 一 0000a ,因为 存在 下 述 运算 顺序 ,使 得 
(0(00))(Oa ) 一 (00)(COa ) 一 DCOa) 一 bc =a 
因此 回答 “1”. 而 对 串 bca ,由 于 (pc)a 一 aa 一 0,0(ca) 一 0 一 c, 因 此 回答 “0”. 说 明 算 
法 的 设计 思想 ,并 给 出 最 坏 情 况 下 的 时 间 复 杂 度 . 
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贪心 法 (Greedy Approach) 是 一 种 通用 的 算法 设计 技术 ,在 许多 最 优化 问题 求解 中 得 到 
了 广泛 应 用 . 比如 著名 的 图 的 最 小 生成 树 的 Prim 算法 和 Kruskal 算法 , 单 源 最 短路 径 的 
Dijkstra 算法 ,数据 压缩 的 Huffman 算法 等 . 特别 是 对 于 许多 NP 难 的 组 合 优化 问题 ,目前 
仍旧 没有 找到 有 效 的 算法 ,于 是 采用 比较 好 的 近似 算法 就 成 了 一 种 可 行 的 途径 ,而 贪心 法 常 
常用 于 这 些 近 似 算法 的 设计 . 贪心 法 与 第 3 章 的 动态 规划 算法 不 一 样 . 动态 规划 算法 在 某 一 
步 决 定 优化 函数 的 最 大 或 最 小 值 时 ,需要 考虑 到 它 的 所 有 子 问 题 的 优化 函数 值 ,然后 从 中 选 
出 最 优 的 结果 . 贪心 法 的 求解 过 程 也 是 多 步 判 断 , 每 步 判 断 时 不 考虑 子 问题 的 计算 结果 ,而 
是 根据 当时 情况 采取 某 种 “只 顾 眼 前 ”的 贪心 策略 来 决定 取舍 . 显然 这 种 决策 的 计算 工作 量 
比 起 动态 规划 要 少 得 多 ,这 也 是 贪心 法 具有 更 高 效率 的 原因 . 但 是 ,这 也 为 算法 的 正确 性 带 
来 新 的 问题 . 对 于 动态 规划 算法 来 说 ,只 要 满足 优化 原则 , 子 问题 的 递 推 关系 正确 ,所 设计 的 
动态 规划 算法 就 是 正确 的 . 然而 对 贪心 法 来 说 , 那 种 “短视 的 "贪心 策略 有 时 候 只 能 导致 局 部 
最 优 ,而 不 是 全 局 最 优 . 比如 求 最 短 哈密 顿 回路 的 问题 ,如 果 每 步 都 选 从 当前 顶点 出 发 的 最 
短 边 ,最 终 得 到 的 整个 回路 未 必 最 短 . 因此 ,怎样 选择 合适 的 贪心 策略 并 证 明 该 策略 的 正确 
性 就 成 了 算法 设计 的 关键 . 我 们 先 通过 一 个 例子 简要 阐述 贪心 法 的 设计 思想 ,然后 介绍 证 明 
贪心 策略 正确 性 的 方法 ,最 后 给 出 一 些 典 型 的 应 用 实例 . 


4.1 贪心 法 的 设计 思想 


先 看 一 个 简单 的 例子 . 

例 4.1 有 ?7 项 活动 申请 使 用 同一 个 礼堂 ,每 项 活动 有 一 个 开始 时 间 和 一 个 截止 时 间 ， 
如 果 任 何 两 个 活动 不 能 同时 举行 , 问 如 何 选择 这 些 活动 ,从 而 使 得 被 安排 的 活动 数量 达到 
最 多 ? 

这 个 问题 可 以 建 模 如 下 : 设 S=={1,2,…,n) 为 活动 的 集合 ,s; 和 广 分 为 活动 i 的 开始 
和 截止 时 间 ,i 二 1.2,…,n. 定义 

活动 i 与 i 相 容 全 5 宇 记 或 sj 宇 fi，i 关 j 

求 S 的 最 大 的 两 两 相 容 的 活动 子 集 A. 

这 是 一 个 活动 选择 问题 . 求解 过 程 就 是 多 步 判断 ,每 步 选 择 一 项 活动 .所 谓 的 贪心 策略 
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就 是 规定 选择 的 依据 . 下 面 尝试 3 种 策略 . 

策略 1: 把 活动 按照 开始 时 间 从 小 到 大 排序 ,使 得 51 过 s; 三 … 三 5, ,然后 从 前 向 后 挑选 
只 要 与 前 面 选 的 活动 相 容 ,就 可 以 把 这 项 活动 选 人 A. 

策略 2: 计算 每 个 活动 的 占用 时 间 , 即 f; 一 s;, 然 后 按照 占用 时 间 从 小 到 大 对 活动 排序 ， 
使 得 fi 一 5 三 f; 一 ss 过 … 三 1 一 s, ,然后 从 前 向 后 挑选 ,只 要 与 前 面 选 的 活动 相 容 ,就 可 以 
把 这 项 活动 选 入 A. 

策略 3: 把 活动 按照 截止 时 间 从 小 到 大 排序 ,使 得 用 三 /三 … 三 f,, 然 后 从 前 向 后 挑 
选 , 只 要 与 前 面 选 的 活动 相 容 ,就 可 以 把 这 项 活动 选 和 人 A. 

上 面 这 些 策略 基本 上 是 基于 人 的 直觉 .策略 1 是 为 了 更 早 地 开始 占用 ,也 许 能 安排 得 更 
多 一 些 ; 策 略 2 是 时 间 占 用 少 的 先 安排 ,这 样 似 乎 可 以 腾 出 更 多 的 时 间 给 其 他 活动 ;策略 
3 是 早 完成 的 先 安排 ,以 便 多 给 后 面 的 活动 留 下 时 间 . 初 看 似乎 都 有 一 点 道理 ,但 是 这 些 策 
略 并 不 是 都 能 得 到 最 优 解 的 . 

策略 1 是 不 正确 的 ,反例 如 下 : S={1,2,3},5 一 0, 方 一 20,% = 二 2, fo 二 5,53 二 8, fs 
15. 如 果 先 选 开始 时 间 早 的 活动 ,那么 必 选 活动 1, 但 是 由 于 与 后 面 两 项 活动 都 不 相 容 ,于 是 
得 到 A 二 {1). 显然 选择 A' 一 {2,3} 是 更 好 的 解 . 
策略 2 也 是 不 成 功 的 .反例 如 下 : S 一 {1,2,3),% ==0, 有 1 二 8,ss 二 7, fs 二 9,ss 二 8, fs 
15. 巩 ie We fz 一 $s 竺 fs 一 ss 三 有 1 一 5s. 但 是 由 于 活动 2 与 其 他 两 项 活 
We 于 是 得 到 解 A 一 {2} ,而 另 一 个 解 A’ 二 {1,3} 显 然 更 好 . 

这 两 个 反例 给 在 图 4. be 


0 2 5 8 10 15 20 0 2 5 8 10 15 20 
图 4.1 两 个 反例 


策略 3 是 一 个 正确 的 算法 .我 们 先 给 出 伪 码 ,然后 用 数学 归纳 法 证 明 它 的 正确 性 . 


算法 4.1 Greedy Select 

输入 : 活动 集 S 二 {1,2,…,n}) ,活动 i 的 开始 时 间 s; 和 截止 时 间 fi, i=1,2,…,n, 且 /1 寺 … 志 /， 
输出 : ASS, 选 中 的 活动 子 集 

1. A<—1{1} 

-| // 已 选 入 的 最 后 一 个 活动 的 标号 

3. fori<-2 ton do 

加。 加 高 天 为 // 判 断 相 容 性 

5. then A<AU{2 

6. ji 


7. return A 

算法 4. 1 的 解 就 是 集合 A 的 全 体 活动 . 这 些 活动 的 最 终结 束 时 间 是 最 后 一 个 活动 的 截 
止 时 间 , 即 :一 max{ 记 |AEA)}. 

例如 输入 集合 S$ 王 41.2.…,10} ,每 项 活动 的 开始 时 间 和 截止 时 间 如 表 4. 1 所 示 . 


表 4.1 活动 的 开始 时 间 和 截止 时 间 


人 1 2 3 4 5 6 7 8 9 10 
Es 3 2 5 4 5 6 8 8 2 
fi 4 5 6 7 9 10 11 12 1 


算法 将 首先 选择 活动 1, 它 的 截止 时 间 是 4, 活动 2 和 3 的 开始 时 间 都 小 于 4, 因 此 与 活 
动 1 不 相 容 . 接着 后 面 活动 4 的 开始 时 间 是 5, 可 以 选 活动 4. 活动 4 的 截止 时 间 是 7, 活动 
5.6 和 7 都 在 时 刻 7 之 前 开始 ,不 相 容 ;接着 考查 活动 8, 与 活动 4 相 容 ,可 以 选 入 . 活动 
8 的 截止 时 间 是 11, 后 面 的 活动 9 和 10 都 不 能 再 选 了 . 最 后 得 到 活动 集 A 二 11,4,8) ,最 终 
完成 时 间 是 :一 11. 

从 伪 码 不 难看 出 ,算法 4. 1 只 有 一 个 for 循环 , 它 的 时 间 复 杂 度 是 O(n). 

下 面 用 数学 归纳 法 给 出 一 个 简单 的 证 明 . 我 们 对 算法 所 做 的 选择 步 数 进行 归纳 ,证 明 对 
任意 正 整数 &, 算 法 的 前 & 步 选择 都 能 导致 一 个 最 优 解 . 

定理 4.1 算法 Select 执行 到 第 &A 步 ,选择 &A 项 活动 =1.i,…, 必 ,那么 存在 最 优 解 
A 包含 记 ==1,is ,i 

证 将 S 中 的 活动 按照 截止 时 间 递增 顺序 排列 . 

归纳 基础 :k=1 时 ,算法 选择 了 活动 1. 我 们 仅 需 要 证 明 : 存在 一 个 最 优 解 包含 了 活动 
1. 设 A={ii,is，,…, 霹 ) 是 一 个 最 优 解 ,如 果 鼠 隆 1, 那 么 用 1 替换 卉 ,得 到 A’, 即 

A’ = (A— {i}) U {1} 

那么 A’ 和 A 的 活动 个 数 相等 . 且 活 动 1 比 i 结束 得 更 早 , 因 此 和 i ,is,，…,ij 等 活动 都 相 
容 . 于 是 A' 也 是 问题 的 一 个 最 优 解 . 

归纳 步骤 : 假设 对 于 任意 正 整 数 k, 命 题 正 确 . 令 十 二 1,i,,…,is 是 算法 前 & 步 顺 序 选 
择 的 活动 ,那么 存在 一 个 最 优 解 

A= 人 {人 = 1 }UB 
如 果 令 S 是 S 中 剩 下 的 与 记 ,i,。,….is 相 容 的 活动 构成 的 集合 , 即 
S 一 (人 115 过 万 JES) 

那么 也 是 S 的 一 个 最 优 解 . 如 若 不 然 ,假如 S 有 解 刀 ,1B'| 二 | 了 B| ,那么 用 B' 替 换 B 以 后 得 
到 的 解 {二 1,is，,…,ii)}UB' 将 比 A 的 活动 更 多 ,与 A 是 最 优 解 矛 盾 . 

根据 对 归纳 基础 的 证 明 . 算 法 第 一 步 选 择 结束 时 间 最 早 的 活动 总 是 导致 一 个 最 优 解 , 故 
对 子 问题 S' 存 在 一 个 最 优 解 B* 二 {iri1,…*}. 由 于 B* 与 B 都 是 S' 的 最 优 解 ,因此 |B* | 一 
| 加 |; 于 基 

WW bb UU = = 

与 A 的 活动 数目 一 样 多 ,也 是 一 个 最 优 解 , 而 且 恰 好 包含 了 算法 前 & 十 1 步 选择 的 活动 . 根 
据 归纳 法 命题 得 证 . 

定理 4. 1 告诉 我 们 ,算法 前 & 步 的 选择 都 将 导致 最 优 解 .其 中 上 二 1,2,…. 因为 至 多 有 
nn 项 活动 ,被 选择 的 活动 个 数 不 会 超过 ,因此 算法 至 多 在 nn 步 内 结束 ,结束 时 得 到 的 就 是 问 
题 的 最 优 解 . 


击 全 器 
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如 果 我 们 把 例 4. 1 加 以 推广 ,比如 说 对 每 项 活动 赋予 一 个 收益 值 w ,我 们 的 目标 不 再 是 
寻找 具有 最 多 活动 数目 的 安排 ,而 是 具有 最 大 收益 的 安排 ( 例 4. 1 则 对 应 于 每 项 活动 的 效益 
都 相等 的 特殊 情况 ), 那么 贪心 算法 不 再 有 效 , 请 读者 举 出 反例 ,并 针对 这 个 推广 的 活动 选 
择 问 题 设计 有 效 的 算法 . 

通过 这 个 例子 可 以 对 贪心 法 做 一 点 分 析 . 在 算法 运行 过 程 中 , 较 大 子 问题 的 解 恰好 包含 
了 较 小 子 问题 的 解 作为 子 集 . 在 证 明 中 则 通过 较 小 子 问题 解 的 最 优 性 推导 出 较 大 子 问题 解 
的 最 优 性 . 这 与 动态 规划 的 算法 设计 中 的 优化 原则 本 质 上 是 一 样 的 . 从 这 个 例子 可 以 看 出 使 
用 贪心 法 设计 技术 的 要 素 是 ， 

(1) 贪心 法 适用 于 组 合 优化 问题 ,该 问题 满足 优化 原则 . 

(2) 求解 过 程 是 多 步 判 断 过 程 , 最 终 的 判断 序列 对 应 于 问题 的 最 优 解 . 

(3) 判断 依据 某 种 “短视 的 "贪心 选择 性 质 , 性 质 的 好 坏 决 定 了 算法 的 成 败 . 

(4) 贪心 法 必须 进行 正确 性 证 明 . 


4.2 关于 贪心 法 的 正确 性 证 明 


在 上 面 关于 活动 选择 的 例子 中 已 经 看 到 : 可 以 通过 对 算法 步 数 的 归纳 来 证 明 贪 心 法 的 
正确 性 . 此 外 ,也 可 以 通过 对 问题 规模 的 归纳 来 证 明 贪心 法 的 正确 性 . 下 面 我 们 通过 装载 问 
题 来 说 明 这 种 证 明 方法 . 

例 4.2 有 集装箱 1,2,…,n 准备 装 上 轮船 . 其 中 集装箱 i 的 重量 是 ww; ,i 二 1,2,…,n. 
已 知 轮船 最 多 装载 量 是 C, 每 个 集装箱 的 重量 rw 近 C, 且 对 集装箱 无 体积 限制 . 问 如 何 选择 
而 使 得 装 上 船 的 集装箱 个 数 最 多 ? 

设 zx; 二 1 表示 第 i 个 集装箱 可 以 装 上 船 ,否则 x; 二 0, 则 这 个 问题 可 以 描述 为 : 


n 
max > ) zi 
和 


wa iC 
i=1 


Xi=0,], i=1,2,%,n 
这 是 一 个 整数 规划 问题 , 也 是 0-1 背包 问题 的 特殊 情况 . 对 于 0-1 背包 问题 可 以 使 用 
动态 规划 算法 求解 .但 是 对 这 个 问题 有 更 好 的 算法 一 一 贪心 法 . 贪心 选择 策略 非常 简单 ,就 
是 “ 轻 者 先 装 ”, 直 到 再 装 任 何 集装箱 将 使 轮船 载重 量 超过 C 时 停止. 


算法 4.2 Loading 

输入 : 集装箱 集合 N 二 {1,2,…,n) ,集装箱 i 的 重量 wi; ,i 二 1,2,…,n 
输出 : SN, 准 备 装 入 船 的 集装箱 集合 

.对 集装箱 重量 排序 ,使 得 ww 过 ws 过 … 过 ww 

:J4-{1)} 


. W<—w 


if W+w<C 
then W<W+tw; 


1 
2 
入 
4. for j<2 ton do 
5 
6 
7 I~IU{)} 


贫 心 法 


8. else return JIT,.W 


算法 4. 2 的 时 间 主 要 是 行 1 的 排序 时 间 O(nlogn), 行 4 的 for 循环 总 计 执 行 O(n) 时 
间 ,于 是 算法 的 时 间 复 杂 度 是 O(nlogn). 

为 了 使 用 对 实例 规模 的 归纳 来 证 明 算 法 的 正确 性 ,需要 先 叙述 一 个 可 以 归纳 证 明 的 
命题 . 

定理 4.2 ”对 于 任何 正 整数 4, 算法 4. 2 都 对 个 集装箱 的 实例 得 到 最 优 解 . 

证 k==1, 只 有 1 个 集装箱 , 其 重量 由 委 C, 任 何 算法 都 只 有 一 种 装 法 ,就 是 将 这 只 集 
装 箱 装 上 船 . 算法 4. 2 得 到 最 优 解 . 

假设 算法 对 于 规模 为 A 的 输入 都 能 得 到 最 优 解 ,考虑 规模 为 k 十 1 的 输入 N= 二 {1,2,…， 
k 十 1) ,W 二 {wi ,ws，… ,twit1) 是 集装箱 重量 ,其 中 避 二 wz 三 … 二 win. 从 NN 中 拿 掉 最 轻 的 
集装箱 ,得 到 : 


N’ 一 N 一 (1) 一 (2.3,… ,十 1) 
W’=WO— {ww} 
C= C—w 
根据 归纳 假设 ,对 于 N’,W’ 和 CC’, 算法 4.2 得 到 最 优 解 I. 令 
TI 一 了 U {1} 


那么 I 是 NN 的 最 优 解 .这 也 恰好 是 算法 对 于 N,W,C 的 解 . 
如 车 不 然 ,存在 包含 1 的 关于 N 的 最 优 解 六 (如果 1" 中 没有 1, 用 1 替换 六 中 的 第 一 个 
集装箱 标号 得 到 的 解 也 是 最 优 解 ). 且 |1" | 二 1T| ;那么 所 一 全) 是 关于 N’,W’ 和 C 的 解 且 
| 本 一 区 | 其 天 | 


与 1 的 最 优 性 矛盾 . 

从 上 述 例 子 可 以 看 出 ,用 数学 归纳 法 可 以 证 明 贪 心算 法 的 正确 性 . 在 使 用 归纳 法 之 前 需 
要 叙述 一 个 相关 的 命题 . 如 果 对 算法 步 数 归纳 ,命题 的 主要 内 容 是 : 对 于 任何 正 整数 人 ,贪心 
法 的 前 k 步 都 导致 最 优 解 . 如 果 对 问题 规模 归纳 ,命题 的 主要 内 容 是 : 对 于 任何 正 整数 A, 贪 
心 法 对 于 规模 为 人 的 实例 都 得 到 最 优 解 . 

除了 数学 归纳 法 外 ,也 可 以 使 用 交换 论证 的 方法 来 证 明 贪心 法 的 正确 性 .所 谓 交换 论证 
的 思想 就 是 : 从 任意 一 个 最 优 解 出 发 ,经 过 不 断 用 新 的 成 分 替换 解 中 的 原 有 成 分 来 改变 这 
个 解 . 在 替换 时 要 注意 : 

(1) 替换 的 目的 是 将 它 逐 步 改 变 成 贪心 法 的 解 ; 

(2) 在 替换 中 保证 解 的 优化 函数 值 不 变 坏 ; 

(3) 替换 的 步骤 是 有 限 的 . 

通过 有 限 步 奉 换 , 把 这 个 最 优 解 改变 成 贪心 法 的 解 . 由 于 替换 中 保证 了 贪心 解 的 优化 函 
数值 至 少 和 这 个 最 优 解 的 优化 函数 值 一 样 好 ,从 而 证 明了 贪心 法 的 解 也 是 最 优 解 . 

下 面 给 出 一 个 调度 问题 的 例子 . 

例 4.3 给 定 等 待 服务 的 客户 集合 A 二 11,2,…,n) .预计 对 客户 i 的 服务 时 间 是 1;, 该 
客户 希望 的 完成 时 间 是 d;. 即 T= 过 41 .ts,… st 这 .:D 二 二 di ,ds,…,d, 之 . 如果 对 客户 i 的 
服务 在 d; 之 前 结束 ,那么 对 客户 i 的 服务 没有 延迟 ;如 果 在 d; 之 后 结束 .那么 这 个 服务 就 被 
延迟 了 ,延迟 的 时 间 等 于 该 服务 结束 时 间 减 去 di. 假设 i;.d; 都 是 正 整数 ,一 个 调度 是 函数 
f: A 一 N ,其 中 /( 让 是 对 客户 i 的 服务 开始 的 时 间 ,. 要 求 所 有 区 间 (f(i),f( 店 十 ti) 互 不 重 


击 全 中 
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三. 一 个 调度 f 的 最 大 延迟 是 所 有 客户 延迟 时 间 的 最 大 值 . 例如 : 
A 
T= ,84,10,3 > 
D=< 10;12,15;11;20 > 
那么 对 于 调度 
ffi: {1,2,3,4,5} 一 N 
六 = = = 
客户 1,2,3,4,5 的 延迟 分 别 是 0,1,2,16,10; 最 大 延迟 是 : 
max{0,1,2,16,10} = 16 
不 同调 度 的 最 大 延迟 是 不 一 样 的 ,比如 对 同一 个 实例 的 另 一 个 调度 
fi: {1,2,3,4,5} 一 N 
尖 的 三 由 ”的 三 由 交办 三 2 汐 夫 三 的 三 妆 
客户 1,2,3,4,5 的 延迟 分 别 是 : 0,11,12,4,10; 最 大 延迟 是 : 
max{0,11,12,4,10} = 12 
这 两 个 调度 的 安排 见 图 4. 2. 


0 5 15 23 27 30 

I I ] 

客户 1 客户 4 客户 2 。 ”客户 3 客户 5 
图 4.2 两 个 调度 


我 们 的 问题 是 ; 给 定 A 王 (1,2, ,1)},T 王 到 三 人 ,人 >,D 王 一 d ,ds ,dd 二 , 求 具 
有 最 小 延迟 的 调度 人 
服务 调度 问题 可 以 如 下 进行 建 模 : 给 定 集合 A 一 11,2，…z),T 一 一 二 ,ta 全,D 一 
< 二 di ,ds,…,d, 二 , 求 函 数 /: A 一 N 使 得 
min{max{f (2) 一 丰收 
Ya E Asijs f+fO) 或 者 Fo7) 十 雪 委 GD 
考虑 下 面 的 贪心 算法 : 按照 截止 时 间 d; 从 小 到 大 选择 任务 ,在 安排 时 不 留 空闲 时 间 . 


算法 4.3 Schedule 


输入 : A, T,D 

输出 : 了 

1. 排序 A 使 得 di 寺 d; 志 …<d， 

CAA Dt) 

3. i<-2 

4. while i<n do 

所 hi // 任 务 i 一 1 的 结束 时 刻 就 是 任务 i 的 开始 时 刻 
6. ii 十 1 


不 难看 出 算法 4. 3 的 时 间 复 杂 度 是 O(nlogn). 


贫 心 法 


下 面 使 用 交换 论证 的 方法 来 证 明 这 个 算法 是 正确 的 . 我 们 需要 分 析 一 下 算法 得 到 的 解 
与 其 他 最 优 解 的 区 别 . 

首先 可 以 看 出 算法 的 解 了 没有 空闲 时 间 . 其 次 ,考虑 调度 ,如 果 4d; 二 dj, 但 是 /iD 
(7) , 换 句 话说 ,完成 时 间 较 早 的 任务 i 反而 被 安排 在 完成 时 间 较 晚 的 任务 j 的 后 面 ,就 称 
二 i,j 一 是 f 的 一 个 逆序 . 一般 最 优 解 可 能 存在 逆序 ,但 是 算法 的 解 没有 逆序 . 这 是 算法 得 到 
的 解 与 一 般 最 优 解 的 区 别 : 没有 空闲 时 间 ,没有 逆序 . 

如 果 一 个 最 优 解 有 空闲 时 间 ,我 们 可 以 将 安排 在 空闲 时 间 后 面 客户 的 服务 都 前 移 个 
时 间 单 位 ,得 到 的 仍旧 是 最 优 解 . 于 是 我 们 的 转换 从 一 个 没有 空闲 时 间 的 最 优 解 开始 . 

引 理 4.1 所 有 没有 逆序 .没有 空闲 时 间 的 调度 具有 相同 的 最 大 延迟 . 

证 假设 了 是 没有 逆序 .没有 空闲 时 间 的 调度 ,于 是 在 了 中 具有 相同 完成 时 间 的 客户 
必须 被 连续 安排 . 比如 讲 ,iso，…,ii 是 从 时 刻 to 开始 的 & 个 连续 安排 的 客户 ,其 完成 时 间 都 
是 d, 其 中 最 大 延迟 的 客户 是 最 后 一 个 客户 i ,被 延迟 的 时 间 是 : 


天 
to 十 pe —d 
j=1 


第 
4 
章 


这 与 ,is，… ,i 的 排列 顺序 无 关 . 

根据 上 述 引 理 , 只 要 得 到 一 个 没有 空闲 时 间 , 没 有 逆序 的 解 ,就 和 算法 得 到 的 解 的 最 大 
延迟 是 相等 的 .我们 的 证 明 思 想 是 : 从 一 个 没有 空闲 时 间 的 最 优 解 出 发 ,在 不 改变 最 优 性 的 
条 件 下 ,转变 成 没有 逆序 的 解 . 

注意 ,如 果 一 个 最 优 调度 存在 逆序 ,那么 存在 相 邻 位 置 的 客户 构成 的 逆序 . 这 两 个 客户 
的 次 序 交 换 , 只 影响 他 们 之 间 的 逆序 ,其 他 逆序 都 不 会 改变 ,于 是 所 得 到 的 解 比 原来 解 的 逆 
序数 减少 1. 因为 任何 排列 的 逆序 总 数 不 超 过 n(n 一 1)/2, 至 多 经 过 n(n 一 1)/2 次 相 邻 客 户 
的 交换 ,就 可 以 得 到 没有 逆序 的 调度 . 剩 下 的 问题 就 是 : 这 样 交换 以 后 能 不 能 保证 解 的 最 优 
性 不 变 . 请 看 下 面 的 定理 . 

定理 4.3 在 一 个 没有 空闲 时 间 的 最 优 解 中 ,最 大 延迟 是 ~, 如果 仅 对 具有 相 邻 着 序 的 
客户 进行 交换 ,得 到 的 解 的 最 大 延迟 不 会 超过 

证 ”假设 这 个 没有 空闲 时 间 的 最 优 解 是 / .最 大 延迟 是 x. 如 图 4. 3 所 示 , 具 有 相 邻 逆序 
的 客户 是 i 和 j,f( 让 三 /(j),d; 记 dj. 设 交换 客户 i 和 j 之 后 得 到 的 调度 为 ,在 中 由 于 
对 客户 j 的 服务 时 间 提 前 了 .因此 它 的 延迟 时 间 不 会 增加 . 其 他 客户 的 延迟 不 变 , 只 有 ii 的 
延迟 有 可 能 增加 . 下面 证 明 i 增加 后 的 延迟 不 超过 . 


5 st Sttitty 


i 
st Stiitty 


图 4.3 交换 i 和 j 不 增加 调度 的 最 大 延迟 


设 在 f 调度 下 ,对 客户 i 服务 开始 时 间 是 . 即 f(i) 二 s. 那么 对 i 的 服务 在 s 十 ti 时 间 结 
束 , 此 刻 就 是 对 j 开始 服务 的 时 间 /(j). 对 j 的 服务 在 /(j) 十 wy 时间 结 束 . 此 刻 恰 好 是 : 
GO) 十 右 王 GD) 十 在 十 右 一 十 丰 十 右 
于 是 在 /调度 下 对 7 的 延迟 
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delay(f,j) = st —d; 
显然 这 个 延迟 不 超过 / 的 最 大 延迟 , 即 
delay(f,7) 二 7r 
在 交换 客户 i,j 之 后 ,对 i 服务 的 结束 时 间 就 是 在 f 调度 下 对 j 服务 的 结束 时 间 
s 十 ti 十 .于 是 在 了 调度 下 对 i 的 延迟 
delay(f’ ,i) 上 $ 十 和 闪 十 二 一 看 


因为 4 之 dj ,于 是 
delay(f’ ,i) = delay(f ,7) 
从 而 得 到 
delay(f’,i) < delay(f,7) <r 
许多 贪心 算法 的 证 明 中 都 利用 了 交换 论证 的 思想 ,数学 归纳 法 和 交换 论证 是 证 明 贪 心算 
法 正确 性 的 最 重要 的 两 种 方法 . 除 此 之 外 还 有 一 些 其 他 方法 ,在 后 面 的 问题 中 还 会 给 予 介 绍 . 


4.3 ”对 贪心 法 得 不 到 最 优 解 情况 的 处 理 


有 些 组 合 优化 问题 的 贪心 算法 效率 很 高 ,对 于 该 问题 的 某 些 实例 可 以 得 到 最 优 解 ,对 另 
外 一 些 实例 却 不 能 得 到 正确 的 解 .但 是 由 于 问题 本 身 的 难度 ,目前 能 够 对 所 有 的 实例 都 得 到 
最 优 解 的 算法 的 时 间 常 常 是 指数 量 级 的 . 类 似 这 样 的 问题 在 实践 当中 是 很 多 的 ,比如 著名 的 
背包 问题 就 是 其 中 的 一 个 .针对 这 种 情况 就 需要 做 出 某 种 权衡 ,也 许 贪心 法 在 处 理 实际 问题 
时 还 可 以 用 . 对 这 种 问题 主要 的 处 理 方法 有 两 个 : 一 是 对 输入 做 出 分 析 ,指出 输入 在 满足 哪 
些 条 件 下 贪心 法 是 正确 的 ,而 且 判 定 这 些 条 件 的 时 间 比 较 少 ,至 多 不 超过 算法 本 身 的 运行 时 
间 . 二 是 分 析 贪 心 法 的 误差 ,确定 它 对 所 有 的 输入 实例 得 到 的 解 (近似 解 ) 与 最 优 解 的 误差 至 
多 有 多 大 . 

下 面 以 找 零钱 问题 为 例 简要 说 明 关 于 输入 分 析 方面 的 工作 ,至 于 基于 贪心 策略 的 近似 
算法 的 性 能 将 在 专门 介绍 近似 算法 的 第 10 章 加 以 阐述 . 

例 4.4 设 有 ?7 种 硬币 ,其 重量 分 别 为 rw yres ,…,zw，* 币 值 分 别 为 由 一 1,w ,ww，* 且 
< 二 ww 所 ,um 现在 需要 用 这 些 硬币 付款 的 总 钱 数 是 Y. 问 : 如 何 选 择 这 些 硬币 而 使 得 付 
钱 的 硬币 总 重 最 轻 ? 

不 妨 设 币 值 和 钱 数 都 为 正 整数 . 令 选 用 第 i 种 硬币 的 数目 是 x; ,那么 这 个 问题 可 以 建 模 
如 下 : 


min{ Dr) 
Du =Y 


Xi€EN, i=1,2,%,n 
个 问题 可 以 用 动态 规划 算法 求解 . 设 Fi(y) 表 示 用 前 种 硬币 .总 钱 数 为 y 的 最 小 重 
量 : 那 么 递 推 方程 为 : 
Fun(y) = min {Fi(y— vnran)Twnrn} k=1,2,…n—1, y=0,1,,Y 


yd 
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Fi(y) = wi | 局 0 


不 难看 出 ,上 述 动态 规划 算法 的 时 间 复 杂 度 是 O(z 允 ). 这 是 一 个 伪 多 项 式 时 间 的 算法 . 

下 面 使 用 贪心 法 求解 . 基于 一 般 生 活 经 验 , 硬 币 单位 价值 的 重量 越 小 ,在 付款 时 可 能 使 
用 的 硬币 重量 越 小 . 因此 采用 的 贪心 策略 就 是 先 选 “单位 价值 重量 最 小 ”的 硬币 . 在 一 般 的 币 
值 系 统 中 ,不 妨 假设 


TY TO2 Zn 
Ul vs 总 


于 是 根据 贪心 法 进行 选择 时 ,应 该 尽 可 能 使 用 标号 大 的 硬币 . 
设 允 许 使 用 前 & 种 零钱 ,总 钱 数 为 y 时 贪心 法 得 到 的 总 重 为 Ce(>), 则 有 如 下 递 推 公式 : 


ER [这 | 上 ceoy 二 


Gi(y) 一 ru 之 |=mwy i Lg 


上 述 递 推 公 式 的 含义 是 : 在 可 选 硬币 是 标号 为 1,2,…:, 的 硬币 时 ,第 k 种 硬币 的 个 数 
至 多 可 以 用 [Ly/vi 个 .按照 上 面 的 贪心 策略 ,要 尽量 使 用 第 k 种 硬币 ,因此 x 二 Ly/v]. 这些 
硬币 的 重量 是 wly /ve 剩 下 的 钱 数 是 y 一 vi Ly/vJ, 这 是 在 尽量 使 用 标号 为 k 的 硬币 付款 
后 所 剩 的 不 足 v 的 余 款 , 即 y mod vi. 这 部 分 钱 只 能 用 更 小 币值 的 零钱 付款 ,也 就 是 说 只 能 
使 用 标号 为 1,2,…,k 一 1 的 硬币 ,于 是 得 到 一 个 子 问 题 . 使 用 贪心 法 继续 求解 这 个 子 问 题 ， 
得 到 的 总 重量 是 Gi_1(y mod wh). 把 这 个 重量 与 标号 为 k 的 硬币 重量 加 起 来 就 是 最 终 的 总 
重量 .由 于 1 号 硬币 的 价值 是 1, 而 要 付款 的 钱 数 是 y. 于 是 需要 y 枚 硬币 ,因此 硬币 总 重量 
是 wiy, 这 就 是 递 推 关 系 的 初 值 G1(y). 

使 用 上 述 递 推 公式 ,可 以 从 最 大 的 硬币 币值 开始 ,找到 第 一 个 小 于 或 等 于 > 的 we， 计算 
一 Ly/ot 剩 下 的 钱 数 yi 二 y 一 ww lyy/ot 与 上 一 步 类 似 ,继续 用 贪心 法 对 进行 类 似 处 
理 ,……, 直 到 剩余 钱 数 w 小 于 vs 或 wx 一 0 为 止 . 令 zi 二 y4. 算法 结束 . 

上 述 贪心 法 的 运行 时 间 是 多 项 式 时 间 . 但 是 贪心 法 的 问题 是 : 不 能 保证 对 所 有 的 输入 
都 得 到 最 优 解 . 考虑 下 面 的 反例 . 设 ww 一 1,uw 一 5,w 一 14,uw 一 18,rw 一 1 一 1,2,3.4,Y 一 
28. 按照 贪心 法 ,该 实例 的 解 是 zx, 二 1,xs 二 2, 总 重量 是 3, 即 用 1 枚 币值 18 的 硬币 和 2 枚 币 
值 5 的 硬币 . 简单 的 观察 就 可 以 发 现 ,使 用 2 枚 币值 14 的 硬币 是 更 好 的 解 . 

看 到 这 里 ,可 能 会 产生 这 样 的 问题 : 对 什么 输入 这 个 贪心 法 能 得 到 最 优 解 呢 ? 下 面 的 
定理 回答 了 这 个 问题 . 

定理 4.4 对 于 任意 正 整 数 y. 当 k=1 和 2 时 .都 有 Gi(y) 二 Fi(y). 

证 当 k=1 时 ,显然 有 Gi(y)=Fi(y) 二 wy. 

当 A 一 2 时 ,得 到 最 优 解 的 递 推 公式 是 : 


Fs(y) = veuty — vax2) ware} 


今 


JJCzzyy) = Fi(y— vrs) + wxs 
Fs(y)= min {f(x,y)} 


0<z, <Ly/vol 


那么 ,为 证 明 Fs(y) 二 Gz(y), 可 以 观察 f(x; ,y) 随 zs 增长 而 变化 的 情况 . 如 果 (zs ,y) 随 


圩 全 中 
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zz 的 增加 单调 减少 ,那么 当 zx; 取得 最 大 值 时 , (zxs,y) 反 而 取得 最 小 值 , 即 F,(y) 达 到 最 
优 .下 面 计算 f(x,y) 一 f(zz 十 6,y): 
Ce 一 十 人 
[FiCy— vr) + wr]— [Fi(y—v (rto)) +w (zs tO)] 
其 中 6 二 0 表示 zs 的 增 量 . 
由 于 FF (y) 二 wiy, 于 是 
f(xy)— frst6,y) 
=[wi (yO— vz) 二 wre dO— [wy CO— v(x ) w(x 0)] 
[wy Tl Vo Ta + wax | [wy Tl U2 T2 Tl V20 + tos To 十 wa6] 
=(wivs 一 zz)0 过 0 
上 面 公式 推导 的 最 后 一 步 是 由 于 


wi Tz 
一 二 一 > ru 二 rul = ws 
Ul vs 


综 上 所 述 , 当 zs 取得 最 大 值 (也 就 是 贪心 法 的 xz; 值 ) 时 Fs(y) 达 到 最 优 . 于 是 Gs(y) 一 
F,(y). 
下 面 考虑 对 k 二 2 的 输入 会 有 什么 结果 . 
定理 4.5 对 每 个 正 整 数 k, 假 设 对 所 有 的 非 负 整数 y 有 Gi(y) 王 Fi(y) ,那么 
GH(y) GW SOFm(y) = Gl(y) 
证 充分 性 ,如果 Fr Cy) 王 Gui(y) ,由 于 Feri(y) 三 Fi(y), 于 是 有 
Ga(y) = Fa(y) < Fi(y) = Gi(y) 
必要 性 . 设 Giri(y) 三 Gi(y) ,由 于 Firi(y) 是 最 优 解 , 因 此 有 
Fin(y) < GH(y) <G(y) 
如 果 FiriCy) 中 的 zi 二 0, 那 么 Fi(y) 二 Firi1(y), 从 而 有 
Gi(y) = Fi(y) = Fi(y) < Gui(y) Gi(y) 
如 果 Firn(y) 中 的 zt 天 0, 令 y =y— Vi :那么 
Fn(y) = Fi(y’) C4.1) 
由 此 得 到 
Gy = By) = Fhn(y dD) EGH(Yy) EGY IFny) 一 Gy ) (4.2) 
将 这 个 结果 和 y 一 y 十 wit1zat1 代 入 得 
Gan(y) 一 Gray + vr) = wz t+ Gaul(y’) 
一 zotzua + Fn(y’) (利用 式 (4. 2)) 
一 zzea t+ Fi(y’) (利用 式 (4. 1)) 
=Fmn(y nr) = Fm(y) 
定理 4.5 说 明 ,如果 对 前 & 种 硬币 贪心 法 都 能 得 到 最 优 解 ,那么 对 k 十 1 种 硬币 贪心 法 
也 得 到 最 优 解 的 充分 必要 条 件 是 Ger1(y) 三 Gi(y). 但 是 完成 这 个 条 件 的 验证 需要 对 所 有 的 
y 计算 Geinm(y) 和 Gi(y), 而 yy 可 以 是 任意 正 整 数 ,验证 算法 的 复杂 度 高 . 我 们 需要 更 实用 的 
验证 方法 .下 面 的 定理 给 出 了 一 个 可 以 实际 验证 的 条 件 . 
定理 4.6 ”对 每 个 正 整 数 &, 假 设 对 所 有 的 非 负 整 数 > 有 Ge(Cy) 王 及 Cy) 且 存在 户 和 9 满足 


Vn = 轧 凡 一 9 
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其 中 06 二 vi ,p 为 正 整 数 , 则 下 面 的 命题 等 价 : 

(1) Gini(y) 二 Fain(y) ,对 一 切 正 整数 y 

(2) Geni (pws) = Fer (pw) 

(3) witit G0) prws 

证 (1) 二 (2). 令 y= 二 pvs 即 可 . 

(2) 过 (3). 由 于 使 用 & 十 1 种 硬币 的 重量 至 少 不 比 使 用 种 硬币 的 重量 更 重 ,于 是 有 
Fin(y) 志 Fi(y) ,而 Fi(y) 二 Gi(y), 因 此 


才 上 加 


Fmn(y) < G(y) (4.3) 
令 y 二 pv ,代入 条 件 (2) 和 式 (4.3), 有 
GueH (pus) = Fn (pvi) < Gpv) = pw (4.4) 
根据 贪心 法 定义 和 veri 二 pv 一 6 有 
Ge (ppv) = Gv 十 6) = wet G0) = wen t+ G0) (4.5) 


将 式 (4.5) 代 入 式 (4.4) 得 条 件 (3), 即 
wen + Gi (0) < Pro 
(3) 过 (1). 根据 定理 4.5,Gii(y) 志 Gi(y) 全 Fin(y)= 二 Guri(y). 使 用 反 证 法 ,我 们 只 
需 证 明 : 如 果 Gu (Cy)>Ge(y) ,一 定 有 win 十 G4 (0) 之 pws 即 可 . 
假设 y* 是 使 得 Giri(y) 三 Gi(y) 不 成 立 的 最 小 正 整 数 , 显然 三 w+i ,那么 有 
Gy ) 一 GrHCy” ) = wt+Ga(ly — vn) 


上 式 两 边 加 上 G4 (6) 得 到 
GO 十 Gy ) < 十 GeC6) 十 Guy — vn) (4. 6) 
因为 已 知 贪心 法 对 A 种 硬币 得 到 最 优 解 ,于 是 
Gily’ + ZG)+Gy") (4.7) 
而 


"中 省 Cn 十 的 站 (3 Vat1) pwr Cy Vat1 ) 


所 以 


Gi(y” +0) GLpvrt Cy" — vn)] pwitG(ly” — vn) (4.8) 
将 式 (4.7) 和 式 (4.6) 代 入 式 (4. 8) 得 
pwrtGy’ —vn) 一 Gy 十 9) ZG) +Gy’) 
wn GO) 十 Gy — vn) 


于 是 


Pwrt Gy —Vn)— Gay ”一 UV) wt G0) 
因为 y 是 使 Gui(y) 三 Gi(y) 不 成 立 的 最 小 正 整 数 , 于 是 Gini(y* 一 V4) 夺 Gi(y* 一 v1)， 
从 而 得 到 
Pwr = wa + G0) 

定理 4.6 的 条 件 (3) 也 是 一 个 判定 对 于 A 十 1 种 硬币 贪心 法 能 否 得 到 最 优 解 的 充分 必要 
条 件 . 但 是 与 定理 4. 5 的 条 件 不 同 .这 个 条 件 与 y 的 大 小 无 关 , 进 行 实际 验证 是 可 行 的 . 对 于 
给 定 的 ,由 vi 二 pv 一 8 计算 p 和 6 需要 常数 时 间 , 然 后 代入 wri 十 G4 (6) 三 pw 验证 不 
等 式 是 否 成 立 . 计算 Gi (6) 仅 需 O(k) 时 间 . 考虑 对 所 有 的 & 二 3,4.….n, 逐 项 做 上 述 验 证 ,至 
多 需要 O(n) 次 .于 是 ,总 的 验证 时 间 为 O(kn) 一 O(02) ,这 在 实践 中 是 可 行 的 . 因此 定理 4. 6 
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的 条 件 (3) 是 一 个 可 以 对 给 定 输入 进行 有 效 验 证 的 充分 必要 条 件 . 
那么 条 件 (2) 有 什么 用 呢 ? 如 果 通 过 验证 条 件 (3) ,发 现 (3) 不 满足 ,于 是 可 以 断定 贪心 
法 对 于 & 十 1 种 硬币 的 输入 不 能 保证 得 到 最 优 解 . 那么 根据 两 个 条 件 等 价 的 性 质 , 条 件 (2) 必 
然 被 破坏 ,这 就 是 说 Giri(pvs) 二 Fer (pv). 不 难看 出 ,pv 就 是 使 得 贪心 法 不 能 得 到 正确 
解 的 一 个 > 值 ,是 一 个 “出 错 点 ”. 因此 这 个 定理 也 叫做 “一 点 定理 ”. 在 贪心 法 不 能 正确 工作 
时 ,条 件 (2) 可 以 帮助 我 们 找到 一 个 简单 的 反例 . 
下 面 验证 一 下 前 面 提 到 的 例子 . 
例 4.5 设 妃 ==1,vs= 二 5,v3 二 14,w4 二 18,wi 二 1,i 二 1,2,3,4, 对 这 个 硬币 系统 ,贪心 法 
能 不 能 对 所 有 的 y 正确 工作 ? 
解 ”根据 定 理 4.4, 有 Fi(y)==Gi(y) ,Fs(y)==Gs(y). 
下 面 验证 G3(y) 二 F;(y). 首先 根据 
Vn = pur—6d, Oe<u, ppEZt 
得 14==w 二 3vs 一 1, 即 p= 二 3,6=1. 于 是 
ws 十 Gs(6) = 二 1 十 Gs(1) = 二 1 十 1=2 
pws =3X1=3 
满足 tw 十 Gs(6) 三 prws ,根据 定理 4.6 有 Gs(y) 二 Fs(y). 
接着 考查 是 否 有 Gs(y)= 二 Fs(y)? 
同样 计算 得 18 二 vw, 二 2vs 一 10, 即 p= 二 2,6==10. 于 是 
wh 十 G3(6) = 二 1 十 G3(10) 一 1 十 2 一 3 
pws=2X1=2 
于 是 tw 十 G3(0) 二 pws ,Gs(y) 不 是 最 优 解 . 根据 定理 4.6 可 知 有 G4(pvs) 二 Fi(pvs). 不 妨 
验证 这 个 反例 对 不 对 . 


Gs(28) = [28/18J+L10/5J= 1 十 2 一 3 
Fi(28) = 28/14=2 
F 是 我 们 看 到 ,贪心 法 的 解 需要 3 枚 硬币 ,可 是 最 优 解 仅 需要 2 枚 硬币 . 


4.4 ”贪心 法 的 典型 应 用 


贪心 法 在 计算 机 算法 设计 中 有 许多 重要 的 应 用 ,下 面 简单 介绍 最 优 前 级 码 、 最 小 生成 树 
和 单 源 最 短路 径 等 问题 . 


4.4.1 最 优 前 缀 码 


在 计算 机 中 需要 用 0-1 字符 串 作为 代码 来 表示 信息 ,为 了 正确 解码 必须 要 求 任何 字符 
的 代码 不 能 作为 其 他 字符 代码 的 前 绥 . 这 样 的 码 称 为 二 元 前 缀 码 . 比如 代码 Q={001,00， 
010,01} 就 不 是 二 元 前 级 码 , 其 中 码 字 表示 的 信息 分 别 是 字符 a.6.c 和 4 , 即 
ax 00s BO0# cx dl0s :0d 
如 果 接 收 到 序列 0100001, 那 么 可 能 有 两 种 译 码 方法 : 
分 解 为 01.00.001， 译作 d,b,a 
分 解 为 010,00,01， 译作 c,6b,d 


IT 


贫 心 法 


由 于 译 码 的 歧义 ,这 种 码 是 不 能 用 的 . 而 二 元 前 级 码 就 没有 这 个 问题 了 . 从 第 一 个 字符 开始 
依次 读 和 人 每 个 字符 (0 或 者 1) ,如 果 发 现 读 到 的 子 串 与 某 个 码 字 相等 . 就 将 这 个 子 串 译作 对 
应 的 码 字 ( 这 里 不 会 出 错 ,因为 这 个 子 串 不 是 任何 其 他 码 字 的 前 级 ) ;然后 从 下 一 个 字符 开始 
继续 这 个 过 程 ,直到 读 完 输入 的 字符 串 为 止 . 

二 元 前 组 码 的 存储 通常 采用 二 又 树 结构 , 令 每 个 字符 作为 树叶 ,对 应 这 个 字符 的 前 组 码 
看 作 根 到 这 片 树叶 的 一 条 路 径 . 如 图 4. 4 所 示 ,规定 每 个 结 点 通 向 左 儿 子 的 边 记 作 0, 通 向 
右 儿 子 的 边 记 作 1 ,那么 这 棵 二 又 树 对 应 的 前 组 码 是 : 

{00000,00001,0001.001.01,100,101,11》 

不 同 字符 在 信息 中 出 现 的 频率 不 同 . 设 C= 二 {zi ,zs，… ,zx,) 是 n 个 字符 的 集合 ,zx; 的 频 

率 是 f(zi) ,i 二 1,2,…,n, 那 么 存储 一 个 字符 所 使 用 的 二 进 制 位 数 的 平均 值 是 : 


第 
4 
章 


B= De J)d (zi) 


其 中 d(xi) 是 表示 字符 zx; 的 二 进 制 位 数 ， 也 就 是 局 的 码 长 . 由 于 一 个 二 元 前 组 码 对 应 了 一 
和 
度 , 即 树叶 的 深度 . 那么 存储 一 个 字符 的 平均 二 进 制 位 数 恰 好 就 是 这 棵 树 在 给 定 频率 下 的 平 
均 深 度 ,也 称 为 这 棵 树 的 权 . 图 4.4 中 每 个 码 字 的 频率 分 别 是 : 

00000: 5%, 00001: 5 中 ， 0001: 10%， 001: 15%， 

01: 25%，, 100: 10%, 101: 10%, 11: 20% 


00000 00001 
图 4.4 一 个 前 缓 码 对 应 的 二 叉 树 


存储 这 个 码 的 一 个 字符 平均 需要 的 二 进 制 位 数 是 : 
B=[(5 二 5)x5+10Xx4 二 (15 十 10 十 10) x3 十 (25 十 20) Xx2j] 二 100 
一 0.5 十 0.4 十 1.05 十 0.9 一 2.85 

不 难看 出 ,对 应 于 同一 组 频率 可 以 构造 出 不 同 的 二 又 树 ,这 些 二 又 树 所 对 应 的 前 级 码 的 
平均 字符 占用 的 位 数 也 不 一 样 . 占用 位 数 越 少 的 压缩 效率 越 高 . 压缩 效率 最 高 , 即 每 个 码 字 
平均 使 用 二 进 制 位 数 最 少 的 前 绥 码 . 称 为 最 优 二 元 前 缀 码 . 根据 上 面 的 分 析 不 难看 出 ,在 给 
定 频 率 下 ,对 应 于 最 优 二 元 前 级 码 的 二 又 树 是 平均 深度 最 小 , 即 权 最 小 的 二 叉 树 .如 果 叶 片 
数 恰好 是 2 ， et 1/n. 那 么 这 棵 树 应 该 是 一 棵 均衡 的 二 又 树 ,每 片 树 
叶 都 分 布 在 第 有 层 上 . 但 是, 对 于 任意 给 定 的 7 个 频率 (zx) ,f(zs),… ,f(z,) ,如 何 构 造 一 
棵 对 应 于 最 优 二 元 前 级 码 的 二 又 树 ? 这 就 是 我 们 需要 解决 的 问题 . 
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例 4.6 最 优 前 级 码 问 题 . 

给 定 字符 集 C= {x1 ,x: ,… ,zx,} 和 每 个 字符 的 频率 f(zi) ,i 二 1,2,…,n, 求 关于 C 的 一 
个 最 优 前 级 码 . 

一 个 著名 的 构造 最 优 前 级 码 的 贪心 算法 就 是 哈 夫 曼 (Huffman) 算 法 . 先 给 出 它 的 伪 码 . 

算法 4.4 Huffman(C) 

输入 : C 二 {xz1， zs，… ,zn) 是 字符 集 ,每 个 字符 频率 f(x), i 二 1,2,…,n. 


输出 : Q // 队 列 

1. no—|Cl 

2. QC // 按 频率 递增 构成 队列 Q 

3. for il1 to 7 一 1 do 

4 xz<—Allocate— Node() // 生 成 结 点 = 

5.。 >x. Left 一 Q 中 最 小 元 // 取 出 Q 中 最 小 元 作为 = 的 左 儿 子 
6。 zz.right<-Q 中 最 小 元 // 取 出 Q 中 最 小 元 作为 = 的 右 儿子 
7. ff tf) 

8 Jrsert(Q,z) // 将 = 插入 Q 

9. return Q 


以 八进制 字符 集 C=={0,1,2,3,4,5,6,7} 为 例 , 其 中 字符 的 频率 X100 分 别 是 : 
f(0)=7101)=5, f(2)=10, f(3) = 15, 
RA = FY = OD = 0 KDD=W 
初始 队列 Q 二 {5,5,10,10,10,15,20,25) ,根据 算法 先 找 到 频率 最 小 的 字符 0 和 1 做 兄弟 ， 
其 父 结 点 频率 是 5 十 5 二 10, 于 是 队列 Q 二 {10,10,10,10,15,20,25). 第 二 步 找 频率 为 10 和 
10 的 两 个 结 点 做 兄弟 ,其 父 结 点 的 频率 是 20, 于 是 队列 Q= 二 {10,10,15,20,20,25). 第 三 步 
还 是 找 频率 10 和 10 的 两 个 结 点 做 兄弟 ,其 父 结 点 的 频率 是 20, 于 是 队列 Q=115,20,20， 


20,25). 第 四 步 找 频率 为 15 和 20 的 结 点 做 兄弟 , 父 结 点 频率 是 35, 于 是 队列 Q== {20,20， 
25,35), 第 五 步 找到 的 结 点 频率 是 20 和 20, 父 结 点 频率 是 40, 于 是 队列 Q 二 {25 ,35,40}, 


第 六 步 找到 的 结 点 频率 是 25 和 35, 父 结 点 频率 是 60, 于 是 队列 Q 二 140,60). 最 后 一 步 把 
剩 下 的 两 个 结 点 做 兄弟 得 到 树 根 ,队列 Q= {100} ,算法 结束 ,从 而 得 到 图 4. 4 所 示 的 二 又 树 
(注意 : 如 果 频 率 相同 的 项 不 止 一 个 ,所 构造 的 树 与 算法 的 实现 有 关 , 可 能 解 不 是 唯一 的 ,但 
是 权 值 相等 ). 有 了 这 棵 树 ,根据 树 根 到 叶片 的 路 径 , 就 可 以 得 到 对 应 的 二 元 前 级 码 . 

该 算法 在 行 2 需要 O(nlogn) 的 时 间 对 频率 排序 , 行 3 的 for 循环 执行 O(n) 次 ,循环 体 
内 行 8 的 插入 操作 需要 O(logn) 时 间 , 于 是 算法 时 间 复 杂 度 是 O(nlogn). 

下 面 证 明 Huffman 算法 的 正确 性 . 

引 理 4.2 设 C 是 字符 集 , YcEC,f(c) 为 频率 ,xz,yEC， f(z),f(y) 频 率 最 小 ,那么 存 
在 最 优 二 元 前 级 码 使 得 rz,y 的 码 字 等 长 , 且 仅 在 最 后 一 位 不 同 . 

证 假设 T 是 一 棵 最 优 二 元 前 级 码 对 应 的 二 又 树 , 且 zxz,y 不 是 最 深层 的 兄弟 ,那么 存 
在 最 深层 的 2 片 树 叶 a 和 6, 使 得 dr(x) 志 dr (a),f(x) 寺 f(a),dr(y) 志 dr(0),f(y) 三 
了 (6). 如 图 4.5 所 示 , 把 xz 与 a 交换 ,y 与 6 交换 ,得 到 树 T' .那么 两 棵 树 的 权 值 之 差 是 : 

BCT) 一 B(T') = Df Od — DDdr(D) 
iEC i€EC 


=[f(z)dr(z)+ fdr(y) t+ fadrla) t+ fb) dr(b)] 


一 [LFGz)dar(z) 十 FCy)dar(Cy) 十 Fa)dr(a) 十 GO)dr(O)] 
=[fCa)dr(z) 十 FCy)dr(y) 十 Fa)dr(Ca) 十 CO)dr(O)] 
一 [LFGz)dr(a) 十 Gy)dr(b) 十 Ga)drCz) 十 CGO)drCy)] 
=[Fz) 一 fa)][ar(z) — drGa)]+[f Cy) — £006) Jadr(y) — dr(b)] 
=0 
于 是 T' 也 是 一 棵 最 优 二 元 前 级 码 的 二 又 树 . 


图 4.5 把 最 小 频率 的 树叶 交换 到 最 底层 


引 理 4.3 设 工 是 二 元 前 组 码 C 所 对 应 的 二 叉 树 , Vz,yET,zr'y 是 树叶 兄弟 ,x 是 x 
与 y 的 父亲 , 令 了 人 =T 一 (zy),FGz)=FGz) 十 F(Cy),T 是 对 应 于 二 元 前 级 码 
C = (C— {zy)) U {2} 
的 二 叉 树 ,那么 
B(T)= B(T)+ f(z) + f(y) 
证 YcEC 一 {zx,y), 有 
dr(c) = dr(M)f(dr(c) = fedr (ce) 
由 于 x 是 x 与 y 的 父亲 ,因此 有 
dr(x) = dr(y) 一 dr(z) 十 1 
于 是 ,将 上 式 代 入 得 
FCz)adrCz) 十 FCy)drCy) 一 CFCz) 十 FCy))Cdr(Cz) 十 1) 
一 (=)dr(z) 十 (FCz) 十 7FCy)) 


从 而 有 
BCT)=BD dr) = > GD)drGD) 十 FCz)drCz) 十 FCy)dzr(Cy) 
ET 


i€ Ti#ry 


= > GD)dr(D 十 /Cdr(z) 十 CFGz) 十 7C)) 


i€ET i 
=B(CT) T+ f(z) + f(y) 

下 面 通过 对 实例 规模 的 归纳 来 证 明 Huffman 算法 的 正确 性 . 因为 对 于 一 个 字符 ,不 存 
在 代码 压缩 问题 .这 里 的 实例 规模 至 少 是 2. 

定理 4.7 Haffman 算法 对 任意 规模 为 n(n 三 2) 的 字符 集 C 都 得 到 关于 C 的 最 优 前 级 
码 的 二 叉 树 . 

证 n= 二 2, 字 符 集 C={zi,zxz) ,不管 f(z) 和 f(x) 的 值 是 什么 ,Huffman 算法 得 到 的 
二 叉 树 对 应 的 代码 都 是 0 和 1, 每 个 码 字 只 用 1 位 ,所 以 是 最 优 前 级 码 . 

假设 Huffman 算法 对 于 规模 为 k 的 字符 集 都 能 得 到 最 优 前 级 码 的 二 又 树 . 考虑 一 个 规 


圩 三 器 
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模 为 k 十 1 的 字符 集 C= 二 {zi ,x2，… ,zit1)， 其 中 zi ,zs EC 是 频率 最 小 的 两 个 字符 . 令 
C= (C— {zi,7z2)) U {2} 
f(z) = f(r) + f(r) 
那么 C=={zx3 ,Ts,… ,zrt1,z) 是 规模 为 k 的 字符 集 , 根 据 归纳 假设 ,Huffman 算法 得 到 
一 棵 关于 字符 集 C' .频率 f(z) 和 f(x;) (i 二 3,4,…,k 十 1) 的 最 优 前 级 码 的 二 叉 树 T'. 如 
图 4.6 所 示 , 把 zx 和 zs 作为 x 的 儿子 附加 到 T' 上 ,得 到 树 了, 那么 工 是 关于 字符 集 
C= (CC—{z})) U {ziszs} 
的 最 优 前 级 码 的 一 棵 二 又 树 . 如 车 不 然 , 必 存在 权 更 小 的 二 叉 树 T* ,上 且 根 据 引 理 4. 2,z 和 
y 可 以 是 T* 的 最 深层 的 兄弟 树叶 . 去掉 T 中 的 xz 和 zs ,并 令 其 父 结 点 的 权 值 为 / (zx) 二 
f(zi) 十 /(xzs). 根据 引 理 4. 3, 所 得 二 叉 树 T* 满足: 
B(T*’)= BOT*)—[f(z) + f(z) < BT)— [f(r) + f(r)] = BOT') 
这 与 T 是 一 棵 关于 C 的 最 优 前 组 码 的 二 又 树 矛 盾 . 


= 


Xl 加 
Ey 
图 4.6 把 zi 与 xz; 加 到 树 T 上 图 4.7 一 个 归并 过 程 


Huffman 算法 可 以 用 于 文件 归并 . 
例 4.7 文件 归并 问题 . 
设 S 二 {有 1,…,f,) 是 一 组 不 同 长 度 的 有 序 文件 构成 的 集合 ,其 中 f; 表示 第 i 个 文件 含 
有 的 记录 个 数 . 现在 使 用 二 分 归并 方法 将 这 些 文件 归并 成 一 个 有 序 文件 . 归并 过 程 可 以 看 成 
一 棵 二 又 树 .2 个 输入 文件 作为 树叶 ,文件 ; 和 7 归并 ,归并 后 的 文件 就 作为 i 和 j 的 父亲 ， 
经 过 "一 1 次 归并 形成 一 棵 树 . 设 S=={21,10,32,41.,18,70) 是 6 个 有 序 文件 的 集合 ,图 4.7 
给 出 了 一 种 归并 次 序 : 第 一 轮 , 文 件 1 与 2 归并 ,文件 3 和 4 归并 ,文件 5 和 6 归并 ,分 别 得 
到 含 31.73 和 88 个 记录 的 文件 . 其 中 21 十 10= 二 31, 32 十 41 王 73，18 十 70 王 88 ,归并 后 新 文 
件 所 含 记 录 数 分 别 标记 在 相关 的 父 结 点 上 . 第 二 轮 . 取 含 31 和 73 个 记录 的 文件 继续 归并 ， 
得 到 104 个 记录 的 文件 . 最 后 将 104 个 记录 的 文件 与 88 个 记录 的 文件 归并 ,得 到 含有 
192 个 记录 的 文件 ,归并 过 程 结束 . 
归并 过 程 中 的 主要 操作 是 记录 之 间 的 比较 .文件 i 和 j 归并 的 比较 次 数 至 多 等 于 fi 十 
方 一 1. 不 同 的 归并 方法 所 做 的 比较 次 数 是 不 一 样 的 . 对 于 上 面 的 归并 方法 ,比较 次 数 是 : 
(21 十 10 一 1) 十 (32 十 41 一 1) 十 (18 十 70 一 1) 十 (31 十 73 一 1) 十 (104 十 88 一 1) 
二 30 填 72 二 87 十 103 十 罗 1 = 483 
上 述 输入 实例 也 可 以 采用 下 述 归 并 次 序 : 初始 文件 7 一方 . 然后 陆续 把 f; 并 入 了 中 ， 
i 二 2,3,…,6. 那么 归并 的 比较 次 数 是 : 
(21 十 10 一 1) 十 (31 十 32 一 1) 十 (63 十 41 一 1) 十 (104 十 18 一 1) 十 (122 十 70 一 1) 


贪心 法 


二 30 十 62 十 103 十 121 十 191 = 507 
我 们 的 目标 是 对 于 给 定 的 S 找 一 个 在 最 坏 情况 下 比较 次 数 最 少 的 归并 次 序 . 
从 上 面 的 归并 过 程 中 可 以 看 到 ,如 果树 叶 i 的 深度 是 d (i) ,那么 文件 i 的 每 个 记录 ,从 
其 父 结 点 开始 直到 树 根 ,在 路 径 上 的 每 个 结 点 都 要 参与 一 次 比较 ,总 的 比较 次 数 恰好 等 于 它 
的 深度 di). 考虑 到 归并 树叶 f; 和 方 ,比较 次 数 等 于 fi 十 fj 一 1, 每 个 内 结 点 都 需要 减 1 ,总 
计 7 一 1 个 内 结 点 ,因此 总 的 比较 次 数 等 于 所 有 叶 结 点 深度 之 和 减 去 2 一 1. 在 上 面 的 例子 
中 ,按照 这 种 计算 方法 ,图 4.7 中 的 归并 次 序 所 做 的 比较 次 数 是 : 
(21 十 10 十 32 十 41) X3 十 (18 十 70) X2 一 5 一 312 十 176 一 5 一 483 
正好 与 前 面 的 结果 一 致 . 一般 来 说 ,归并 的 比较 次 数 可 以 按照 下 面 的 公式 计算 : 
DZ 太一 (一 了 
iES 
在 上 面 关于 优化 函数 的 公式 中 ,如 果 把 文件 记录 数 f; 看 作 字 符 频 率 , 那 么 它 与 前 级 码 


的 平均 位 数 公 式 只 相差 n 一 1. 而 这 个 差 的 大 小 与 树 的 结 辆 
构 无 关 , 仅 依赖 于 输入 规模 ,于 是 Huffman 算法 完全 可 
以 用 到 文件 归并 问题 中 来 . 9 $7 


以 输入 S= 二 {21,10,32,41,18,70) 为 例 , 按 照 Huffman (9) (70) GD (32) 
算法 得 到 的 最 好 的 归并 次 序 如 图 4. 8 所 示 , 所 做 的 比较 动人 的 


次 数 是 : 
(10+18) X4 十 21X3 十 (32 十 41 十 70) x2—5 (0 (3 
二 112 十 63 十 281 = 456 图 4.8 最 好 的 归并 过 程 


4.4.2 最 小 生成 树 


设 无 向 连通 带 权 图 G 二 二 V .E,W 放 , 其 中 ww(e)EW 是 边 e 的 权 . G 的 一 棵 生成 树 是 包 
含 了 G 的 所 有 顶点 的 树 , 树 中 各 边 的 权 之 和 称 为 树 的 权 , 具 有 最 小 权 的 生成 树 称 为 G 的 最 
小 生成 树 . 如 果 G 表示 计划 中 的 道路 网 络 , 结 点 代表 城市 , 边 的 权 值 表示 建造 路 的 费用 , 那 
么 G 的 最 小 生成 树 表示 能 使 这 些 城市 之 间 连 通 的 最 小 费用 . 

下 面 给 出 一 些 关 于 生成 树 的 重要 结果 ,有 关 的 概念 和 证 明 可 以 在 参考 文献 [1] 中 找到 . 

命题 4.1 设 G 是 n 阶 连通 图 ,TT 是 G 的 n 阶 连通 子 图 ,那么 : 

(1) 工 是 G 的 生成 树 当 且 仅 当 工 有 7 一 1 条 边 . 

(2) 如 果 工 是 G 的 生成 树 ,e 代 工 ,那么 TU{fe} 含 有 一 个 圈 ( 回 路 )， 

我 们 的 问题 是 : 给 定 连 通 带 权 图 G. 求 G 的 一 棵 最 小 生成 树 . 求 最 小 生成 树 的 算法 有 两 
个 : Prim 算法 与 Kruskal 算法 . 先 看 Prim 算法 . 

设 G 王 <V, 下 , 友 >, 其 中 V 一 {1,2,…,2)}. 这 个 算法 的 基本 思想 是 将 V 划分 成 两 个 子 
集 S 与 V 一 S. 初 始 S={1). 算 法 每 一 步 从 连通 S 与 V 一 S 的 边 中 挑选 一 条 权 最 小 的 边 , 然 
后 把 这 条 边 所 关联 的 顶点 加 到 S 中 去 .这 条 边 也 就 成 了 生成 树 的 边 . 至 多 经 过 nn 一 1 步 ， 
就 得 到 G 的 一 棵 最 小 生成 树 . 下 面 给 出 算法 的 伪 码 . 


算法 4.5 Prim 
输入 : 连通 图 G 一 王 V,E,W 二 
输出 : G 的 最 小 生成 树 工 


才 上 如 
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1. S—{1};T=@ 

2. while V—S#G do 

3. ”从 V 一 S 中 选择 7 使 得 7 到 S 中 顶点 的 边 e 的 权 最 小 ;T<-TU {e} 

4. SSU{j} 

图 4.9 给 出 了 一 个 Prim 算法 的 运行 实例 . 

初始 S={1},V 一 S=={2,3,4,5,6,7,8}); 

第 1 步 , 找 与 结 点 1 关联 的 最 短 边 : (1,2) 边 ,长 度 为 2, 于 是 把 结 点 2 加 到 S 中 ,S= 
{132). 

第 2 步 , 找 连接 集合 {1,2} 和 {3,4,5,6,7,8} 的 最 短 边 ,是 (1,3) 边 , 边 长 是 3, 于 是 S= 
{1,238); 

第 3 步 , 找 连接 集合 {1,2,3) 和 {4,5,6,7,8) 的 最 短 边 , 是 (2,7) 边 , 边 长 是 7,S= {1,2， 
人 

第 4 步 , 找 连接 集合 {1,2,3,7) 与 {4,5,6,8) 的 最 短 边 ,是 (7,8) 边 , 边 长 是 1,S= {1,2， 
9357578}; 

第 5 步 , 找 连接 集合 {1,2,3,7,8) 与 {14,5,6} 的 最 短 边 ,是 (2,4) 边 , 边 长 是 18,S= {1,2， 
7 

第 6 步 , 找 连接 集合 {1,2,3,7,8,4} 与 {5,6} 的 最 短 边 , 是 (4,6) 边 , 边 长 是 3,S={1,2， 
NR 

最 后 , 找 连 接 集合 {1,2,3,7,8,4,6} 与 {5) 的 最 短 边 , 是 (6,5) 边 , 边 长 是 4. S==V, 算 法 
停止 ,最 终 得 到 的 最 小 生成 树 如 图 4. 9 所 示 . 它 的 权 是 38. 


图 4.9 一 个 最 小 生成 树 的 实例 


下 面 通过 对 算法 步 数 的 归纳 来 证 明 Prim 算法 的 正确 性 . 

定理 4.8 对 于 任意 正 整 数 k=n, 存 在 一 棵 最 小 生成 树 包 含 算法 前 & 步 选择 的 边 . 

证 k= 二 1, 用 反 证 法 证 明 存 在 一 棵 最 小 生成 树 荆 包 含 边 e 二 (1, 让 ,其 中 (1, 让 是 所 有 关 
联 1 的 边 中 权 最 小 的 . 

令 T 为 一 棵 最 小 生成 树 , 假 如 工 不 包含 (1,7) ,那么 根据 命题 4.1:TU{(1,.iD))} 含 有 一 个 
圈 . 设 这 个 圈 中 关联 1 的 另 一 条 边 是 (1.7) , 令 

TY TUY UD 

则 T' 也 是 生成 树 , 且 WCT’) 志 W(T). 

假设 算法 进行 了 k 一 1 步 .生成 树 的 边 为 ei .es ,… ,es-1, 这 些 边 的 上 个 端点 构成 集合 S. 
由 归纳 假设 存在 G 的 一 棵 最 小 生成 树 工 包含 这 些 边 . 

算法 第 & 步 选择 了 顶点 zi: 则 za 到 S 中 顶点 的 边 的 权 值 最 小 , 设 这 条 边 为 一 
(Carsa). 假 设 工 不 含有 边 ex :根据 命题 4.1. 将 es 加 到 了 T 中 形成 一 条 回路 ,这 条 回路 一 定 有 


另外 一 条 连接 S 与 V 一 S 中 顶点 的 边 e. 用 ex 替换 e 得 到 树 工 ” , 即 
T* = YU tt} 

因此 T* 是 G 的 一 棵 生成 树 ,包含 边 e1 ,es，…,ei, 由 于 wle) 夺 w(e), 因 此 W(T* )W(7T). 

根据 数学 归纳 法 ,命题 得 证 . 

下 面 考虑 Prim 算法 的 时 间 复 杂 度 . 

实现 Prim 算法 需要 两 个 数组 wear[1..n] 和 d[1..n], 对 于 i€EV 一 S,near[i] 是 S 中 距 
离 ; 最近 的 顶点 , 换 句 话说 , 它 到 i 的 边 的 权 值 最 小 . d[ 避 是 这 个 最 近 的 结 点 到 i 的 距离 . 初 
始 , 对 于 结 点 i=2,3,…,n, 令 near[ 门 =1,， 如 果 e= 二 (i,1) 是 G 的 边 , 则 4d[ 门 =w(e); 否 则 
4d[ 让 =. 一旦 结 点 i 加 入 到 S 中 , 令 d[ 门 = 一 1, 以 此 来 标记 i€ S. 当 算 法 需要 选择 连通 
S 与 V 一 S 的 最 小 边 时 ,只 需要 检查 每 个 iEV 一 S, 找 到 最 小 的 d[ 门 ,就 可 以 确定 这 条 最 小 
边 ,比如 说 e 二 (j,k),jES,kEV 一 S. 然 后 把 & 加 到 S 中 , 令 d[j== 一 1. 这 个 检查 工作 需要 
O(n) 的 时 间 . 剩 下 的 工作 就 是 修改 V 一 S$ 中 所 有 结 点 i 的 near[ 门 和 d[ 疏 值 . 因为 S 中 除了 
& 外 的 其 他 结 点 到 i 的 最 短 边 和 长 度 已 经 分 别 记录 在 near[ 门 和 d[ 门 中 ,因此 只 需要 检查 边 
,的 权 是 否 小 于 d[ 门 ,如 果 (k, 让 的 权 更 小 , 则 将 near[ 门 更 新 为 k, 且 将 d[ 门 的 值 更 新 为 
(k. 丫 的 权 . 不 难看 出 ,所 有 V 一 S 中 结 点 的 更 新 工作 需要 O(n) 时 间 . 因此 ,算法 每 把 1 个 新 结 
点 加 到 S 中 总 计 需 要 Om) 时 间 . 由 于 需要 加 入 一 1 个 顶点 ,于 是 算法 的 时 间 复 杂 度 是 O02 ). 

下 面 考虑 Kruskal 算法 . 先 给 出 伪 码 . 


算法 4.6 Kruskal 
输入 : 连通 图 G 一 一 V,E,W 二 // 顶 点 数 ” 边 数 六 
输出 : G 的 最 小 生成 树 
1. 按照 权 从 小 到 大 顺序 排序 G 中 的 边 ,使 得 E= {el ,es ，…* ,em) 
T<@ 
.repeat 
e< 正中 的 最 短 边 
让 e 的 两 端点 不 在 同一 个 连通 分 支 
then T<-TU I{e} // 把 e 加 入 树 中 ,合并 连通 分 支 
E<-E—{e} 
.until 本 包含 了 n 一 1 条 边 
需要 说 明 的 是 : 算法 4.6 的 第 一 步 对 边 排序 时 ,不 考虑 环 (过 单一 结 点 的 边 ). 如 果 两 个 
顶点 之 间 有 平行 边 , 那 么 取 其 中 最 短 的 一 条 . 下 面 以 图 4.9 为 例 来 运行 Kruskal 算法 . 
排序 后 的 边 集 E= {ei ,es ,es ,et ves ,egyey vesyesvelo} ,其 中 
eri 一 (7,8)，e 一 (1,2)，e 一 (1.,.3)， ee 一 (4.6)， es 一 (2,3)， 
eg 一 (5,6)，ey 一 (4,5)， es 一 (2.7)，eo 一 (3,8)，eo 一 (2,4) 


0 


we) =1, ez) 一 2， wes) =w(e) =3, wes) = w(es) = 4， 
Ww(er) = 5, w(es)=7, wes)=8, wew) = 18 
初始 T= 名， 


第 1 步 ,T 一 {el}; 
第 2 步 ,算法 选择 es ,T= {ei ,es); 
第 3 步 ,算法 选择 e; ,T= {ei ,es ,es); 


才 上 加 
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第 4 步 , 算 法 选择 es,T 一 (eyez:eayes}; 

第 5 步 , 算 法 考虑 es ,但 是 由 于 es 与 es ,es 构成 回路 ,不 能 选 ,T 不 变 ; 

第 6 步 , 算 法 选择 es ,T= {el ,es ,es ,es ,es); 

第 7 步 ,算法 考虑 e; ,但 是 由 于 e; 与 es ,es 构成 回路 ,不 能 选 ,T 不 变 ; 

第 8 步 ,算法 选择 es ,T= {el ,es ,es ,es ves ,es); 

第 9 步 ,算法 考虑 ee ,但 是 由 于 es 与 e1 ,es ,es ,es 构成 回路 ,不 能 选 ,T 不 变 ; 

第 10 步 ,算法 选择 eo ,T= {el ,es ,es ,es ses ,es ,el). 

最 后 得 到 的 生成 树 如 图 4. 9 所 示 ,恰好 与 Prim 算法 的 结果 一 样 . 当然 ,如 果 图 G 存在 
多 棵 最 小 生成 树 时 ,两 个 算法 得 到 的 解 有 可 能 是 不 同 的 . 

下 面 通过 对 实例 规模 n 的 归纳 来 证 明 Kruskal 算法 的 正确 性 . 为 此 先 说 明 图 的 “ 短 接 ” 
操作 . 设 e=(i, 站 是 G 的 一 条 边 , 所 谓 “ 短 接 ”i 和 j 就 是 : 把 顶点 i 和 j 合并 成 一 个 顶点 ij; 
原来 关联 i 的 边 (i,k) 变 成 边 (ij ,k) ;同样 的 ,原来 关联 j 的 边 (j,/) 变 成 边 (ij ,人 ). 图 4. 10 
给 出 一 个 短 接 边 。 的 两 个 端点 i 和 j 的 例子 . 


图 4.10 短 接 边 e 


定理 4.9 ”对 任意 的 n(n 二 1) 阶 带 权 图 G,Kruskal 算法 都 能 得 到 G 的 一 棵 最 小 生成 树 . 

证 当 n=2 时 ,图 中 只 有 顶点 1 和 2,Kruskal 算法 选择 最 短 边 (1,2) ,命题 显然 为 真 . 

假设 对 于 任意 阶 图 ,Kruskal 算 法 都 是 正确 的 . 考虑 2 十 1 阶 图 G, 设 G 中 最 小 权 的 边 
e 三 (i, 站 .从 G 中 短 接 i 和 j ,得 到 图 G'.G 有 nn 个 顶点 ,根据 归纳 假设 ,使 用 算法 可 以 得 到 
G' 的 一 棵 最 小 生成 树 T'. 令 T==T'U {e}( 把 被 短 接 的 顶点 恢复 原状 ). 则 工 是 关于 G 的 最 小 
生成 树 ， 

如 若 不 然 ,存在 G 的 一 棵 最 小 生成 树 T* ,WC(T* ) 二 W(T). 首先 说 明 存 在 一 棵 这 样 的 
树 T* 包含 边 e. 因为 如 果 efT*, 在 T* 中 加 入 边 e。, 根 据 命题 4.1 形成 一 条 回路 C. 去 掉 
C 中 任意 一 条 其 他 的 边 , 所 得 到 的 生成 树 的 权 不 超过 W(T* ), 且 包含 e. 下 面 在 T* 中 短 接 
i 和 j 就 得 到 G’ 的 生成 树 T* 一 {e), 且 

W(T*—{e)=W(T*)—w(e) <W(T)—w(e) = W(T') 

从 而 与 并 的 最 优 性 矛盾 . 

根据 归纳 法 ,命题 对 任何 自然 数 二 1 都 成 立 . 

下 面 分 析 Kruskal 算法 的 时 间 复 杂 度 .算法 的 时 间 复 杂 度 依赖 于 实现 方案 ,主要 是 算法 
第 5 行 的 操作 . 假设 一 (7) ,怎样 判断 ; 和 7) 是 否 在 同一 个 连通 分 支 中 ? 这 里 需要 给 出 标 
记 顶 点 所 在 连通 分 支 的 方法 . 不 难看 出 ,所 有 的 连通 分 支 构成 对 顶点 集 V 的 一 个 划分 ,每 个 
连通 分 支 都 是 V 的 子 集 ,每 个 顶点 都 在 一 个 连通 分 支 中 ,不 同 的 连通 分 支 彼 此 不 相交 . 我 们 
可 以 用 连通 分 支 中 某 个 顶点 的 标号 作为 连通 分 支 的 名 字 . 比如 G 的 顶点 集 是 : V 二 {1,2.,3， 
4,5,6,7,8} ,当前 的 连通 分 支 是 (1,5,7,8}, {2,3,6}, {4} ,那么 这 些 连通 分 支 可 以 依次 标 
记 为 1,2,4. 假设 需要 判断 边 @ 一 (5.6).e: 一 (1.8) 的 两 个 端点 是 否 在 同一 连通 分 支 中 ,可 以 


贫 心 法 


利用 数组 FIND,FIND[i] 就 是 ;的 连通 分 支 标 记 . 对 于 el 二 (5,6), 因 为 FIND[5]==1， 
FIND[6]==2,FIND[5] 关 FIND[6], 于 是 5 与 6 不 在 同一 连通 分 支 . 对 于 es = 二 (1,8), 因 为 
FINDL1]=FINDL8]=1, 因 此 1 和 8 在 同一 连通 分 支 . 下 面 说 明 如 何 从 给 定 的 图 G 建立 和 
更 新 FIND 数组 . 

初始 ,对 i 二 1,2,…, 令 FIND[ 疏 =i. 设 i 和 j 所 在 的 子 集 分 别 是 A 和 B, 如 果 算 法 选 
择 了 边 (i, 站 ) ,就 要 将 A 和 B 合 并 成 一 个 子 集 ,这 就 需要 更 改 一 部 分 顶点 的 FIND 函数 值 . 
为 了 减少 更 改 标记 的 次 数 , 在 合并 两 个 子 集 时 取 元 素 较 多 的 子 集 名 字 作 为 合并 后 的 子 集 
名 字 . 比如 在 上 面 的 例子 中 ,如果 需要 合并 子 集 {2.3.6} 和 {4} ,我 们 只 需要 令 FIND[4]= 
2.FINDL2]、FINDL3] 和 FINDL6] 的 值 不 变 . 下 面 证 明 : 建立 和 更 改 连通 分 支 标记 的 总 时 
间 至 多 是 O(nlogn). 

引 理 4.4 设 数组 FIND 保存 图 G 中 每 个 顶点 的 子 集 标记 , 两 个 子 集合 并 时 采用 较 大 
子 集 的 标记 作为 合并 后 的 子 集 标记 ,那么 对 于 给 定 的 G, 可 以 在 O(nlogn) 时 间 建 立 和 更 新 
FIND 数组 ,其 中 是 G 中 顶点 个 数 . 

证 初始 建立 n 个子 集 { 引 ,i 二 1,2,…,n. 这 相当 于 对 数组 FIND 赋 初 值 ,使 得 
FINDL 详 一 ;不 难看 出 这 需要 O(n) 时 间 . 下 面 考虑 修改 标记 的 操作 次 数 . Vi EV ,假设 i 在 
子 集 A 中 . 如 果 在 1 次 A 与 B 的 合并 中 标记 FIND[ 门 被 修改 ,根据 约定 ,一 定 有 |A| 志 1B|. 
于 是 有 |AUB| 三 21A1, 这 就 意味 着 i 所 在 的 子 集合 并 后 规模 至 少 加 售 . 假定 i 在 连通 分 支 
建立 过 程 中 经 历 了 k 次 修改 标记 操作 . 初始 含有 i 的 子 集 只 有 1 个 元 素 , 到 次 修改 结束 
后 ,i 所 在 的 子 集 至 少 有 2* 个 元 素 , 由 于 2: 二 nn, 因 此 三 logn. 这 就 对 于 i 的 标记 修改 次 数 给 
出 了 一 个 上 界 . 考虑 到 G 有 ?7 个 结 点 ,于 是 ,所 有 标记 的 修改 至 多 是 O(nlogn) 次 . 由 于 每 个 
标记 的 修改 仅 需要 O(1) 时 间 . 于 是 建立 和 更 改 连通 分 支 标记 的 总 时 间 是 O(nlogn). 

设 G 有 nn 个 顶点 ,m 条 边 , 下 面 考虑 算法 4.6 的 工作 量 . 行 1 对 边 的 排序 需要 OCmlogm) 时 
间 . 根据 引 理 4. 4, 建 立 和 更 新 连通 分 支 总 计 需 要 O(nlogn) 时 间 , 行 3 循环 OC(m) 次 ,循环 体 
内 除去 更 新 连通 分 支 的 时 间 是 O(1) .于 是 算法 的 时 间 复 杂 度 是 : 

OOmlogm + nlogn + m) 
因为 简单 的 连通 图 的 边 数 m 满足 
n(n—1)/2 宇 m 宇 n 一 1 


因此 有 
nlogn = O(mlogm) 和 mlogm = O(mlogn’) = O(mlogn) 

于 是 Kruskal 算法 的 时 间 复 杂 度 是 OGmlogn). 

回顾 前 面 的 Prim 算法 ,时 间 复 杂 度 是 O( 妈 ). Kruskall 算法 的 时 间 复 杂 度 是 
OCmlogn). 到 底 哪个 算法 效率 更 高 一 些 呢 ? 这 依赖 于 图 的 稀 玻 程度 . 如 果 图 中 含有 较 多 的 
边 , 比 如 x 一 B@(n?) ,使 用 Kruskal 算法 的 运行 时 间 是 OCzlogz) ,这 时 Prim 算法 效率 高 一 
些 .但 是 如 果 是 稀 玖 图 .mx 一 B@(n) ,那么 使 用 Kruskal 算法 的 运行 时 间 是 OCzlogz) , 比 Prim 
算法 效率 更 高 . 

最 小 生成 树 有 很 多 应 用 .在 网 络 路 由 和 聚 类 分 析 中 都 会 用 到 最 小 生成 树 . 聚 类 分 析 的 目 
的 是 把 一 个 集合 的 元 素 根 据 某 些 性 质 进行 划分 ,使 得 在 同一 个 划分 块 的 元 素性 质 上 彼此 更 
接近 ,而 在 不 同 划 分 块 的 元 素 差 距 要 尽 可 能 大 . 根据 不 同 需要 可 以 为 聚 类 问题 建立 多 种 数学 
模型 . 其 中 单 链 的 & 聚 类 是 一 种 最 简单 的 模型 . 


第 
4 
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设 集合 S=={1,2,…,n), Vi,jES,i 关 jwd(i,j) 二 d(j ,i) 表 示 i 与 j 的 相似 度 , 假 设 需要 

将 S 划分 成 k 个 子 集 C1,C;,… ,Ci , 聚 类 工 二 {Ci ,Cs,…,Ci} 的 间隔 定义 为 : 
DOU) = nmin(dG)) |i€E GH EC SI RE 
给 定 S 和 S 中 元 素 之 间 的 相似 度 ,我 们 的 目标 是 寻找 使 得 DCL) 达 到 最 大 的 & 聚 类 工 . 

可 以 采用 Kruskal 算法 来 求解 这 个 问题 . 令 S 是 顶点 集 , 对 任意 顶点 i.j, 边 (i, 站 的 权 
就 是 距离 4(i,j) ,于 是 得 到 带 权 图 G. 算法 的 运行 过 程 如 下 : 初始 工 是 空 集 ,存在 个 单元 
素 的 顶点 子 集 . 每 当 工 中 增加 一 条 边 , 就 把 2 个 子 集合 并 , 当 T 中 恰好 得 到 A 个 连通 分 支 
(个 类 ) 时 ,算法 停止 . 如 果 最 终 得 到 一 棵 生成 树 ,也 就 是 只 剩 下 1 个 类 时 ,需要 加 ”一 1 条 
边 ;要 得 到 上 个 类 ,只 需要 加 一 k 条 边 . 为 什么 这 样 做 就 可 以 得 到 一 个 具有 最 大 间隔 的 & 聚 
类 呢 ? 这 个 问题 留 给 读者 思考 . 


4.4.3 单 源 最 短路 径 


在 网 络 中 经 常会 用 到 广播 ,从 一 个 结 点 向 所 有 的 其 他 结 点 发 送 消息 . 比如 在 一 个 实际 的 
分 布 式 网 络 中 , 某 些 服务 器 结 点 可 能 由 于 硬件 或 者 软件 故障 而 失效 ,也 可 能 自己 从 网 络 中 主 
动 退出 . 为 了 传输 的 可 靠 性 需要 经 常 对 结 点 工作 情况 做 检测 . 比如 结 点 i 向 其 他 个 结 点 发 
消息 ,然后 等 待 回应 ,在 某 个 时 间 间 隔 内 根据 回应 情况 判断 网 络 的 连通 现状 . 除 此 之 外 ,在 物 
流 网 络 中 经 常 需 要 从 商品 产地 向 经 销 商 供 货 . 上 面 这些 问 题 都 涉及 路 径 的 规划 ,. 可 以 如 下 建 
立 相应 数学 模型 . 

在 一 个 带 权 有 向 网 络 G 王 天 V, 尼 , 克 过 中 ,每 条 边 e 一 二 ;全 的 权 ww(e) 为 非 负 实数 , 表 
示 从 i 到 j 的 距离 . 网络 中 有 源 点 sEV. 求 从 :出 发 到 达 每 个 其 他 结 点 的 最 短路 径 . 

求解 这 个 问题 的 算法 就 是 著名 的 Dijkstra 算法 . 它 的 设计 思想 是 : 将 V 划分 成 集合 
S 与 V 一 S. 初 始 S={s). 算 法 的 每 一 步 都 把 1 个 结 点 加 入 S, 直 到 S=V 为 止 . 根据 什么 条 
件 来 挑选 加 入 S 的 结 点 呢 ? 算 法 对 每 个 结 点 iEV 一 S. 计 算 从 s 出 发 中 间 只 经 过 S 中 结 点 
且 最 终 到 达 i 的 最 短路 径 , 称 为 从 * 到 i 相对 于 S 的 最 短路 径 , 路 径 长 度 记 为 dist[ i (注意 ， 
如 果 此 刻 s 到 i 不 可 达 , 则 令 dist[ 疏 =09). 通 过 比较 ,从 所 有 dist[Li](iEV 一 S) 中 选 出 最 小 
值 ,比如 dist[ 门 最 小 ,那么 结 点 j 就 是 在 这 一 步 加 入 到 S 中 的 结 点 . 先 给 出 算法 的 伪 码 描 
述 ,其 中 ww(i, 丫 表示 有 向 边 二 i,j 二 的 权 . 

算法 4.7 Dijkstra 

输入 : 带 权 有 向 图 G 二 <V,E,W. 源 点 sEV 

输出 : 数组 工 ,对 所 有 jEV 一 (s) ,LL[ 站 表示 s 到 j 的 最 短路 径 上 j 前 一 个 结 点 的 标号 

1. Se—{s} 

2. dist[s]<0 

5. for iEV—{s} do 

4 dist[i]<—rw(s,i) // 如 果 s 到 i 没有 边 , zs, 站 一 ce 

5. while V—S#A8 do 

6 从 V 一 S 中 取出 具有 相对 S 的 最 短路 径 的 结 点 j ,k 是 该 路 径 上 连接 j 的 结 点 
t. SSUGLDTE 
8 
9 


for iEV 一 S do 
if dist[jj+rw dj ,Ddist[i] 
10. then dist[i]<—dist[j]+rw(j ,i) // 修 改 结 点 i 相对 S 最 短路 径 长 度 


下 面 给 出 一 个 算法 的 运行 实例 . 图 4. 11 是 一 个 带 权 有 向 图 , 源 点 是 1. 


贫 心 法 


第 1 步 ,S 二 {1) ,下面 计 算 结 点 2,3,4,5,6 相对 于 S 的 最 短路 径 . 
dist[2] = 10, dist[3] = dist[4] = dist[5] = ce， dist[6] = 3 
其 中 最 短 距离 是 3, 于 是 结 点 6 加 入 到 S 中 ,得 L[6]=1. 
第 2 步 ,S 二 {1,6) ,修改 距离 dist 如 下 : 
dist[2] = min{3 十 2,10} = 5, dist[5] = min{3 十 1,co) 一 4， 
dist[4] = min{3 十 6,co)} 一 9 
其 中 最 短 距离 是 4, 于 是 结 点 5 加 入 到 S 中 ,得 L[5]=6. 
第 3 步 ,S 二 {1,6,5) ,不 用 修改 距离 ,最 短 距离 是 5, 于 是 结 点 2 加 入 到 S 中 ,得 LL[2]=6. 
第 4 步 ,S 二 {1,6,5,2) ,修改 距离 dist 如 下 : 
dist[3] = min{5 十 7,co) = 12 
其 中 最 短 距离 是 9, 于 是 结 点 4 加 入 到 S 中 ,得 L[4]=6. 
第 5 步 ,S=(1,6,5,2,4} ,不 用 修改 距离 . 
把 最 后 一 个 结 点 3 加 入 到 S 中 ,L[3]=2,S={1,6,5,2,4,3},S=V ,算法 结束 . 得 到 
= 2] = 5 [3] = 地， 
dist[4] = 9 dist[5] = 4; distL[6]=3 
最 后 的 最 短路 径 如 图 4. 11 粗 线 所 示 . 
为 了 证 明 Dijkstra 算法 的 正确 性 ,我 们 需要 证 明 当 算法 在 行 7 选择 把 结 点 7 加 到 S 中 
时 ,dist[ jj 就 是 从 s 到 j 的 最 短路 径 长 度 . 根据 这 个 结果 , 当 S=V 时 ,所 有 的 结 点 都 加 入 到 
S 中 ,于 是 我 们 得 到 了 从 s 到 所 有 其 他 结 点 的 最 短路 径 . 请 看 下 面 的 定理 . 
定理 4.10 设 G= 二 V,E.W 请 是 有 向 带 权 图 , YeEE, 权 w(e) 是 非 负 实 数 . ;EV 是 源 
点 ,short[ 计 是 从 > 到 f 的 最 短路 径 长 度 . 对 于 SCEV ,dist[ 门 是 从 s 到 i 相对 于 S 的 最 短路 径 
长 度 .那么 ,对 于 任何 正 整数 4, 当 算法 进行 第 上 步 时 , YES, 有 dist[i] 二 short[i. 
证 对 4 归纳 . 
k= 二 1,S= 二 {5} ,显然 dist[s] 王 short[s] 一 0. 
假设 对 于 &, 命 题 为 真 , 即 算法 前 & 步 选择 的 结 点 i 都 有 dist[ 让 二 short[ 让 .考虑 算法 在 
第 k 十 1 步 ,选择 了 结 点 w( 其 关联 边 是 一 wx,v 二 ,其 中 & 在 S 中 ). 如 图 4.12 所 示 , 假 若 存在 
另 一 条 从 s 到 vw 的 路 径 工 ,路径 中 第 1 次 离开 S 的 边 是 rz,y> ,其 中 zES,yEV 一 S. 由 于 
算法 在 这 一 步 选择 了 结 点 v, 没 选 结 点 >, 那么 一 定 有 
dist[v] < distLy] 


而 
dist[y]+d(y,v) =L 
这 里 d(y,v) 表 示 y 到 w 的 距离 .于 是 


dist[v] 志 L 


图 4.11 一 个 实例 图 4.12 归纳 证 明 


才 上 加 
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即 算法 对 w 选择 的 路 径 是 ; 到 wv 的 最 短路 径 . 从 而 证 明了 算法 在 第 十 1 步 选 择 v, 有 
dist[v]=shortLv]. 

根据 归纳 法 ,命题 得 证 . 

考虑 单 源 最 短路 径 算 法 的 时 间 复 杂 度 . 算法 每 步 在 S 中 增加 1 个 结 点 ,总 计 O(m) 步 .每 
增加 1 个 结 点 ,需要 修改 V 一 S 中 结 点 的 dist 的 值 . 每 个 值 需要 O(1) 时 间 , 因 此 每 步 要 
O(n) 时 间 . 由 此 可 知 算法 的 时 间 复 杂 度 是 T(n) 二 OC). 

一 章 介绍 了 贪心 法 ,给 出 了 很 多 重要 应 用 的 例子 . 最 后 我 们 把 贪心 法 的 设计 思想 概括 

如 下 : 

(1) 贪心 法 适用 于 求解 优化 问题 ,其 求解 过 程 是 多 步 判 断 过 程 . 每 步 判 断 的 依据 是 某 
个 局 部 最 优 的 策略 , 即 选择 “眼前 ”最 好 的 决策 ,而 不 必 考 虑 前 面 一 系列 决策 的 结果 . 

(2) 一 系列 局 部 最 优 的 决策 不 一 定 导致 全 局 的 最 优 解 ,贪心 法 的 正确 性 必须 要 给 出 
证 明 . 

(3) 算法 的 正确 性 证 明 方 法 包括 数学 归纳 法 和 交换 论证 法 . 使 用 数学 归纳 法 主要 通过 
对 算法 步 数 或 者 问题 规模 进行 归纳 . 如 果 要 证 明 贪心 策略 是 错误 的 ,只 需 举 出 反例 . 

(4) 求解 过 程 是 自 顶 向 下 , 先 做 贪心 选择 ,然后 规模 较 大 的 子 问题 将 归 约 为 规模 更 小 的 
子 问题 . 

(5) 如 果 贪 心 法 得 不 到 最 优 解 , 可 以 对 问题 的 输入 进行 分 析 或 者 估计 算法 的 近似 比 . 

(6) 通常 对 原始 数据 排序 之 后 ,贪心 法 往往 是 一 轮 处 理 , 时 间 复 杂 度 和 空间 复杂 
度 低 . 


习 题 4 


4.1 设 有 nn 个 顾客 同时 等 待 一 项 服务 ,顾客 i 需要 的 服务 时 间 为 ti ,i 二 1,2,…,n. 从 时 刻 0 
开始 计时 . 若 在 时 刻 上 开始 对 顾客 i 服务 .那么 i 的 等 待 时 间 就 是 +:， 应 该 怎样 安排 n 
个 顾客 的 服务 次 序 使 得 总 的 等 待 时 间 ( 每 个 顾客 等 待 时 间 的 总 和 ) 最 少 ? 
(1) 使 用 贪心 法 求解 这 个 问题 时 的 贪心 选择 策略 是 什么 ? 
(2) 简单 写 出 贪心 法 的 算法 描述 . 
(3) 假设 服务 时 间 分 别 为 {1,3,2,15,10,6,12) ,用 贪心 法 给 出 这 个 问题 的 解 . 

4.2 有 个 底面 为 长 方形 的 物品 需要 租用 库房 存放 . 如 果 每 个 物品 都 必须 放 在 地 面 上 , 且 
所 有 物品 的 底面 宽度 都 等 于 库房 的 宽度 ,那么 第 i 个 物品 占用 库房 面积 大 小 只 需要 用 


它 的 底面 长 度 1; 来 表示 ,i 二 1, 2,…,n. 设 库房 总 长 度 是 工 , 且 > 二 工 . 如 果 要 求 放 


入 库房 的 物品 个 数 最 多 .选用 哪 种 算法 设计 技术 ? 简 述 算法 的 设计 思想 ,证 明 算法 的 

正确 性 ,并 估计 算法 最 坏 情 况 下 的 时 间 复 杂 

4.3” 设 有 一 条 边远 山区 的 道路 AB. 沿 着 道路 AB 分 布 着 所 房子 .这些 房子 到 A 的 距离 
分 别 是 di ,ds dd sd 二 … 二 du). 为 了 给 所 有 房子 的 用 户 提供 移动 电话 服务 ， 
需要 在 这 条 道路 上 设置 一 些 基站 . 为 了 保证 通信 质量 ,每 所 房子 应 该 位 于 距离 某 个 基 
站 的 4 千 米 范围 之 内 .设计 一 个 算法 找到 基站 的 位 置 ,并 且 使 得 基站 总 数 达到 最 少 . 用 
文字 说 明 算 法 的 主要 设计 思想 ;给 出 算法 的 伪 码 描述 ;证 明 算法 的 正确 性 并 给 出 算法 


心 


贫 心 法 


最 坏 情 况 下 的 时 间 复 杂 度 函数 . 


.4 给 定数 轴 X 上 7 个 不 同 点 的 集合 {zz ,zz ,… ,x) ,其 中 民 过 zs 三 … 过 xz. 现在 用 若干 


个 长 度 为 1 的 闭 区 间 来 覆盖 这 些 点 . 设计 一 个 算法 找到 最 少 的 闭 区 间 个 数 和 位 置 ,证 
明 算法 的 正确 性 并 估计 算法 的 时 间 复 杂 度 . 


.5 有 个 文件 需要 存储 在 磁盘 上 ,第 i 个 文件 需要 p; 个 字 节 的 存储 空间 ,i 二 1,2,*…,n. 


磁盘 的 总 容量 是 C, 量 3》)p; 二 C. 


(1) 如 果 要 求 存 人 的 文件 个 数 达到 最 多 ,选用 哪 种 算法 设计 技术 ? 简 述 算法 设计 思 
想 ,证 明 算法 的 正确 性 ,并 估计 算法 最 坏 情况 下 的 时 间 复 杂 度 . 

(2) 如 果 要 求 磁盘 的 剩余 空间 达到 最 小 ,选用 哪 种 算法 设计 技术 ? 简 述 算法 设计 思 
想 , 并 估计 算法 最 坏 情况 下 的 时 间 复 杂 度 . 

6 有 项 作业 的 集合 帮 二 {1,2,…,n) ,每 项 作业 i 有 加 工时 间 1(i)EZt+. 有 一 台 机 器 从 
时 刻 0 开始 工作 ,直到 完成 所 有 的 任务 . 一 个 可 行 调度 / 是 对 J 中 任务 的 一 个 安排 ， 
对 于 i€EJ,f/( 让 是 任务 i 开始 加 工 的 时 间 ,/ 满足 下 述 条 件 : 

80 二 iD 过 GO) 或 JOH SI), j#Ki, ij€EJ 


设 作 业 的 完成 时 间 ww()= 二 (让 十 (让), 求 使 得 平均 完成 时 间 广 3 w (让 最 少 的 调度 . 


.7 假设 零钱 系统 的 币值 是 {1,p.p*,…,p"),p 记 1, 且 每 个 钱币 的 重量 都 等 于 1. 设计 一 个 


最 坏 情况 下 时 间 复 杂 度 最 低 的 算法 ,使 得 对 任何 钱 数 y, 该 算法 得 到 的 零钱 个 数 最 少 . 
说 明 算 法 的 主要 设计 思想 ,证 明 它 的 正确 性 ,并 给 出 最 坏 情 况 下 的 时 间 复 杂 度 . 


.8 有 一 个 考查 队 到 野外 考查 ,在 考查 路 线 上 有 个 地 点 可 以 作为 宿营 地 .已 知 宿营 地 到 


出 发 点 的 距离 依次 为 zi ,zs，,… ,zx,, 且 满足 zi 一 zxs 一 … 一 zx,. 每 天 他 们 只 能 前 进 30 千 
米 , 而 任意 两 个 相 邻 的 宿营 地 之 间 的 距离 都 不 超过 30 千 米 . 在 每 个 宿营 地 只 住 1 天 . 
他 们 希望 找到 一 个 行动 计划 ,使 得 总 的 宿营 天 数 达 到 最 少 . 设计 一 个 算法 求解 这 个 问 
题 , 给 出 算法 的 主要 步骤 ,证 明 算 法 是 正确 的 ,估计 算法 的 时 间 复 杂 度 . 


.9 及 个 进程 pi ,ps，…… ,ps. 对 于 i 二 1,2,…,n, 进 程 p; 的 开始 时 间 为 ;[ 门 , 截止 时 间 为 


d[ij. 可 以 通过 监测 程序 Test 来 测试 正在 运行 的 进程 . Test 每 次 测试 的 时 间 很 短 , 可 
以 忽略 不 计 . 换 句 话说 ,如 果 Test 在 时 刻 : 进行 测试 ,那么 它 将 对 满足 s[ 门 td[ 门 
的 所 有 进程 p; 同时 取得 测试 数据 . 假设 最 早 运 行 的 进程 的 开始 时 刻 是 0, 问 : 如 何 安 
排 测试 时 刻 ,使 得 对 每 个 进程 至 少 测试 一 次 , 且 Test 测试 的 次 数 达 到 最 少 ? 说 明 你 的 
算法 的 主要 设计 思想 ,给 出 伪 码 ,证 明 算法 的 正确 性 ,并 分 析 算 法 最 坏 情况 下 的 时 间 复 


杂 度 . 


.10 考虑 习题 3 的 3. 11 题 关 于 圆 环 上 个 排序 数组 的 归并 问题 . 假设 个 排序 数组 分 别 


含有 整数 zo ,zi ,… ,zi 个 ,如 下 设计 贪心 法 : 计算 所 有 相 邻 两 个 数组 的 元 素数 之 
和 ,从 中 选择 元 素数 之 和 最 小 的 两 个 数组 进行 归并 . 这 种 贪心 法 是 否 能 够 对 所 有 的 实 
例 得 到 最 优 解 ? 证 明 你 的 结果 . 


.11 Dijkstra 算法 要 求 有 向 图 的 边 的 权 是 非 负 实数 . 请 举 出 反例 说 明 , 对 于 某 些 含有 负数 


边 权 的 有 向 图 ,Dijkstra 算法 不 能 得 到 正确 的 解 . 
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设 字符 集 S, 其 中 8 个 字符 A,B,C,D,E,F,G,HH 的 频率 是 f1,f。,…,fs, 且 100X ff; 

是 第 i 个 Fibannaci 数 的 值 ,i 二 1,2,… .8. 

(1) 给 出 这 8 个 字符 的 Huffman 树 和 编码 . 

(2) 如 果 有 个 字符 ,其 频率 恰好 对 应 前 个 Fibanacci 数 ,那么 对 应 的 Huffman 树 
是 什么 结构 ,证明 你 的 结论 . 

设 有 作业 集合 二 {1,2,…,n), 每 项 作业 的 加 工时 间 都 是 1. 所 有 作业 的 截止 时 间 是 

D. 若 作业 i 在 D 之 后 完成 , 则 称 为 被 延误 的 作业 ,并 需要 赔偿 罚款 m(i). 这 里 的 

DD 各 (让 (i 二 1,2,…,n) 都 是 正 整数 , 且 nn 项 m(i) 彼 此 不 等 .本 的 一 个 调度 是 函数 

了 : J>N, 其 中 NN 为 自然 数 集合 ,f(i) 表 示人 作业 i 开始 加 工 的 时 间 ,i 二 1,2,…,n. 设 

计 一 个 算法 求 出 使 得 总 罚款 最 少 的 调度 ,证 明 算法 的 正确 性 并 给 出 最 坏 情 况 下 的 时 

间 复 杂 度 . 

设 有 作业 集合 二 {1,2,…,n) ,每 项 作业 的 加 工时 间 都 是 1. 作业 i 的 截止 时 间 是 

d (站 ,在 d( 让 之 前 完成 则 获得 利润 m( 让 .这 里 的 d6 让 和 m0 让 (i 二 1,2,…,n) 都 是 正 

整数 , 且 所 有 的 m.( 让 彼此 不 等 . 了 的 一 个 调度 是 函数 1: J 一 N, 其 中 入 为 自然 数 集 

合 ,f( 让 表示 作业 i 开始 加 工 的 时 间 , i 二 1,2,…,n. 设计 一 个 算法 求 出 使 得 总 利润 最 

大 的 调度 ,证 明 算法 的 正确 性 并 给 出 最 坏 情 况 下 的 时 间 复 杂 度 . 

有 项 任务 的 集合 本 二 {1,2,…,n) ,每 项 任务 需要 先 放 到 机 器 A 上 进行 预 处 理 , 然 

后 再 放 到 机 器 B 上 加 工 . 第 i 二 1,2,…,n) 项 任务 的 预 处 理 和 加 工时 间 分 别 是 a (让 

和 6(i)， 如果 机 器 A 只 有 1 台 , 机 器 B 的 数量 不 限 , 问 如 何 安排 这 些 任务 在 机 器 A 

上 的 处 理 顺 序 , 以 使 得 总 的 加 工时 间 最 短 ? 总 加 工时 间 的 含义 是 : 从 0 时 刻 机 器 A 

开始 预 处 理 , 到 1 时刻 最 后 一 台 机 器 B 停止 工作 ,总 加 工时 间 就 是 7. 给 出 求解 该 问题 

的 算法 ,用 文字 说 明 算 法 的 主要 设计 思想 和 最 坏 情 况 下 的 时 间 复 杂 度 ,证 明 算法 的 正 

确 性 . 

设 A 王 二 al ,yas ,a 二 ,B= 二 二 b,b;，…,b, 是 两 个 序列 ,其 中 三 nn. 设计 一 个 

OD) 时 间 的 算法 ,判断 B 是 否 为 A 的 子 序列 . 说 明 算法 的 设计 思想 ,给 出 伪 码 并 证 

明 算 法 的 正确 性 . 

设 G 王 二 V, 尼 ,友之 是 一 个 通信 网 络 , 其 中 结 点 集 V 是 站 点 集合 , 边 集 已 是 站 点 之 间 

的 链 路 集合 , VeEE, 权 值 w(e) 表 示 带 宽 . 并 且 假 设 每 条 边 的 权 都 不 相等 . 对 于 任意 

站 点 u,vEV ,一 条 wv 路 径 P 的 最 大 带宽 是 ww(P) 二 minlw(e)), 即 这 条 路 径 上 的 所 

有 边 的 带宽 的 最 小 值 . 而 与 v 之 间 的 最 佳 带宽 w(u.v) 一 max{w(P)|1P 是 一 条 

u-v 路 径 } , 即 所 有 wv 路 径 带宽 的 最 大 值 . 这 也 是 与 v 之 间 通 信 的 最 佳 带宽 . 

(1) 证 明 存 在 一 棵 生成 树 ,使 得 在 这 棵 树 中 ,连接 每 对 结 点 u,v 唯一 路 径 的 最 大 带宽 
等 于 与 v 之 间 的 最 佳 带宽 . 

(2) 设计 一 个 找 这 样 一 棵 生成 树 的 算法 ,并 分 析 算 法 的 时 间 复 杂 度 

设 S== 们 ,2,…,n} 是 项 广告 的 集合 ,广告 1G 一 1,2,… .四 9 有 发 布 开始 时 间 *CD 和 和 

截止 时 间 d(i) ,发 布 效益 是 w(i) ,其 中 (GD 是非 负 整数 ,di) 和 (iD 是正 整 数 , 且 

d(1) 二 qd(2) 二 … 二 qd(n). 我 们 的 问题 是 : 如 何在 S 中 选择 一 组 广告 A ,使 得 A 中 任 


4.20 


4.21 


贫 心 法 


意 两 个 广告 都 相 容 (时 间 段 不 重 倒 ) 且 总 效益 最 大 ? 
(1) 假设 所 有 广告 的 效益 都 相等 , 试 设计 一 个 求解 上 述 问 题 的 算法 ,证 明 其 正确 性 ， 
并 说 明 时 间 复 杂 度 . 
(2) 如 果 效 益 w(i) 可 以 取 任 意 正 整数 ,设计 一 个 算法 求解 这 个 问题 ,用 文字 说 明 算 法 
的 设计 思想 和 主要 步骤 ,分 析 算法 最 坏 情况 下 的 时 间 复 杂 度 . 
有 个 文件 存在 磁带 上 ,每 个 文件 占用 连续 的 空间 . 已 知 第 ;个 文件 需要 的 存储 空 
间 为 s; ,被 检索 的 概率 是 fi,i 二 1.2,…,n, 且 所 十 fz 十 … 十 f, 二 1. 检索 每 个 文件 需 
要 从 磁带 的 开始 位 置 进行 操作 ,比如 文件 i 需要 空间 ;二 310, 存 储 在 磁带 的 121 一 
430 单元 ,那么 检索 该 文件 需要 的 时 间 为 430. 问 如何 排 列 个 文件 而 使 得 平均 检索 
时 间 最 少 ? 设计 算法 求解 这 个 问题 ,说 明 算 法 的 设计 思想 ,证 明 算法 的 正确 性 ,给 出 
算法 最 坏 情况 下 的 时 间 复 杂 度 . 
一 个 公司 需要 购买 n 个 密码 软件 的 许可 证 ,按照 规定 每 个 月 至 多 可 以 得 到 一 个 软件 
的 许可 证 . 假定 每 个 许可 证 目前 售 价 都 是 1000 元 . 但 是 第 i 个 许可 证 的 售 价 将 按照 
六 盖 1 的 指数 因子 增长 ,i 二 1,2,…,n. 例如 ,第 i 个 许可 证 在 1 个 月 后 将 是 x; Xx 1000 
元 ,2 个 月 后 将 是 站 X1000 元 ,k 个 月 后 将 是 rtX1000 元 . 给 定 输入 ,rer， 
给 出 一 个 购买 许可 证 的 顺序 ,以 使 得 花费 的 总 钱 数 最 少 . 设计 一 个 算法 求解 这 个 问 
题 , 说 明 设计 思想 ,证 明 其 正确 性 并 分 析 算 法 最 坏 情 况 下 的 时 间 复 杂 度 . 
给 定 n 个 集合 A1，,…，A, ,每 个 集合 都 由 连续 的 正 整数 构成 , 即 
Ai= {zla 人 <b)}), arvzb ETD, i= 1,2.%9n 
设计 一 个 算法 求 最 小 的 集合 S, 使 得 对 每 个 i=1,2,…,n,|1S 门 A; | 隆信 , 即 每 个 A; 至 
少 含 有 S 中 的 一 个 数 . 
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.十 至 
回溯 与 分 支 限界 


本 章 介绍 算法 设计 的 第 四 种 方法 : 回溯 技术 . 先 用 例子 说 明 回 漳 算 法 设计 的 基本 思想 
和 适用 条 件 ,然后 给 出 主要 设计 步 又 和 效率 分 析 方 法 ,最 后 给 出 求解 优化 问题 的 一 种 改进 回 
淹 方 法 : 分 支 限界 ， 


5.1 回溯 算法 的 基本 思想 和 适用 条 件 


有 些 问 题 ,如 搜索 问题 和 优化 问题 ,它们 的 解 分 布 在 一 个 解 空间 里 ,求解 这 些 搜 索 问题 
的 算法 就 是 一 种 遍历 搜索 解 空 间 的 系统 方法 ,所 以 解 空 间 又 称 为 搜索 空间 . 求解 搜索 问题 
就 是 在 搜索 空间 中 找到 一 个 或 者 全 部 解 ,求解 组 合 优化 问题 就 是 找到 该 问题 的 一 个 最 优 解 
或 所 有 的 最 优 解 . 

回溯 算法 将 搜索 空间 看 作 一 定 的 结构 ,通常 为 树 形 结构 ,一 个 解 对 应 于 树 中 的 一 片 树 
叶 . Re 当 不 能 前 行 时 ,就 后 退 一 步 或 若 
干 步 ,再 从 另 一 个 结 点 继续 搜索 ,直到 所 有 的 结 点 都 试探 过 . 回溯 算法 遍历 一 棵 树 可 以 用 深 
度 优 先 、 pe- 深度 结合 等 多 种 方法 . 为 加 快 搜索 ,人 们 又 给 出 了 分 支 限 界 等 各 
种 在 树 中 剪 枝 的 方法 ,以 改善 算法 的 运行 时 间 . 简单 来 说 ,回溯 (backtracking) 是 一 种 遵照 
某 种 规则 (避免 遗漏 ) 、 跳 跃 式 ( 带 裁剪 ) 地 搜索 解 空 间 的 技术 . 


5.1.1 几 个 典型 的 例子 


例 5.1 8 皇后 问题 .在 有 8X8 个 方 格 的 棋盘 中 放置 8 个 皇后 ,使 得 任何 两 个 皇后 之 间 
不 能 互相 攻击 , 即 在 同一 行 、 同 一 列 不 能 有 两 个 以 上 的 皇后 ,在 与 主 对 角 线 、 副 对 角 线 的 平行 
线 上 也 不 能 有 两 个 以 上 的 皇后 , 试 给 出 所 有 的 放置 方法 . 

解 ”首先 找 出 所 有 可 行 解 , 即 所 有 可 能 的 放置 方法 . 由 于 每 行 不 能 有 两 个 以 上 皇后 ,而 
棋盘 共有 8 行 , 要 放置 的 皇后 个 数 也 恰 有 8 个 ,所 以 在 可 行 解 中 每 行 正 好 有 一 个 皇后 . 这 样 
每 个 可 行 解 可 以 表示 成 一 个 8 维 向 量 二 zzz ,zs 二 ,其 中 心 表 示 第 ; 行 放置 皇后 的 位 
置 ( 列 号 ). 例如 二 4,2,7,1,.3.5.8,6 二 ,表示 第 一 行 中 皇后 放 在 第 4 列 ,…', 第 8 行 中 皇后 放 
在 第 6 列 .所 以 所 有 可 行 解 为 如 下 8 维 向 量 构成 的 集合 { 二 zzz,…,zs 过 |1 委 直入 8, 1 和 
i 委 8). 将 这 些 可 行 解 按 一 定 的 结构 进行 排列 . 在 本 例 中 ,我 们 将 之 排 成 完全 8 又 树 , 即 搜索 
空间 . 搜索 树 有 8 层 , 最 下 层 有 8 个 叶 结 点 . 如 图 5. 1 所 示 . 


回 兰 与 分 支 腿 累 


图 5.1 8 皇后 问题 的 搜索 空间 


回溯 算法 用 深度 优先 策略 遍历 整 棵 树 , 找 出 所 有 解 . 算法 从 树 根 开 始 , 经 过 结 点 二 1 二 ， 
二 1,1>,<<1,1,1>,… 最 后 到 结 点 <8,8,…,8 二 为 止 ,然后 回溯 到 根 ,算法 停止 ,恰好 按 深 
度 优先 顺序 跳跃 式 搜索 了 所 有 的 可 行 解 向 量 . 在 实际 搜索 过 程 中 不 是 真正 遍历 所 有 的 结 点 ， 
如 果 发 现 向 下 搜索 不 可 能 达到 解 结 点 ,就 回头 . 搜索 过 程 是 解 向 量 不 断 生 成 的 过 程 . 根 结 点 
为 空 向 量 ,算法 依次 对 zi ,zs，…,z, 进行 赋值 . 每 进行 一 次 赋值 需要 检查 “ 互 不 攻击 ”的 条 
件 . 当 不 满足 条 件 时 ,算法 不 再 继续 向 下 搜索 ,而 是 从 这 个 结 点 回 到 父 结 点 . 一 旦 对 zz， 
zs， ,Xk 进行 了 赋值 ,算法 就 到 达 某 个 结 点 ,将 该 结 点 标记 为 向 量 二 zi ,zs,…,zx 二 , 称 为 
部 分 向 量 . 从 根 结 点 到 解 结 点 的 路 径 上 的 所 有 标记 正 是 从 空 向 量 到 可 行 解 的 生成 过 程 . 例 
如 ,算法 从 根 结 点 沿 着 边 zi 二 1 走 到 第 一 层 最 左边 的 那个 结 点 ,表示 第 一 行 的 皇后 放 在 第 一 
列 ,该 结 点 的 标记 是 二 1 二 . 按 深度 优先 策略 算法 沿 zs 二 1 走 到 第 二 层 最 左边 的 那个 结 点 , 表 
示 第 二 行 的 皇后 放 在 第 一 列 , 这 违反 了 同一 列 不 能 有 两 个 以 上 的 皇后 的 放置 规则 ,不 满足 约 
束 条 件 ,算法 回溯 到 父 结 点 过 1 二 .下 一 个 选择 是 zz: 一 2, 走 到 第 二 层 从 左边 数 的 第 二 个 结 
点 ,表示 第 二 行 的 皇后 放 在 第 二 列 ,这 违反 了 与 主 对 角 线 平行 的 平行 线 上 不 能 有 两 个 以 上 的 
皇后 的 放置 原则 ,所 以 也 不 可 能 找到 解 .于 是 ,算法 又 回溯 到 父 结 点 二 1>. 这 相当 于 把 这 两 
个 分 支 对 应 的 子 树 从 整 棵 树 中 裁剪 掉 了 . 接着 算法 沿 着 z: =3 走 到 第 二 层 左边 数 的 第 三 个 
结 点 ,表示 第 二 行 的 皇后 放 在 第 三 列 ,这 符合 放置 规则 ,该 结 点 标记 为 二 1,3 二 . 再 按照 深度 
优先 策略 往 下 探查 ,显然 沿 zs 王 1、.zs 一 2.zs 一 3、zs 一 4 的 方向 向 下 的 搜索 都 违背 了 放置 规 
则 ,只 能 回溯 到 过 1,3 过 .下面 可 以 选择 zs 一 5, 对 应 于 该 结 点 的 部 分 向 量 记 为 二 1,3,5 二 . 照 
这 样 不 断 向 下 搜索 ,如 果 得 到 一 个 满足 约束 条 件 的 8 维 向量 , 它 就 是 8 后 问题 的 一 个 解 . 如 
果 从 某 个 结 点 向 下 分 支 的 所 有 方向 都 破坏 了 约束 条 件 ,部 分 向 量 不 能 继续 扩张 , 则 意味 着 以 
这 个 结 点 为 根 的 子 树 中 没有 可 行 解 存 在 .算法 从 这 个 结 点 继续 向 上 回溯 到 其 父 结 点 ,接着 探 
查 父 结 点 其 他 可 能 的 向 下 分 支 . 如 此 下 去 ,可 以 得 到 第 一 个 解 二 1,5,8,6,3,7,2,4> 二 , 按 此 策 
略 再 遍历 其 他 结 点 ,可 得 到 其 余 解 ,共有 92 个 解 . 

一 般 地 ,对 于 nn 皇后 问题 ,搜索 树 有 1 十 n 十 瑾 十 … 十 mw" 个 结 点 ,而 
Le lem = 2n" (7 之 2) 

Wh nn 
2 

在 每 个 结 点 处 ,要 判断 此 位 置 的 皇后 与 已 经 放置 的 皇后 是 否 相 互 攻击 .最 多 要 看 3n 个 
位 置 ( 沿 列 方向 、 主 与 副 对 角 线 方向 ) 是 否 已 有 皇后 , 故 皇后 问题 的 该 算法 在 最 坏 情 形 下 的 
时 间 复 杂 度 为 O(3nX2m") 二 O(n"™'). 这 是 一 个 粗略 的 上 界 估计 . 实际 运行 中 由 于 搜索 树 的 
前 枝 , 时 间 要 少 得 多 . 

例 5.2 0-1 背包 问题 . 一 个 旅行 者 准备 随身 携带 一 个 背包 . 可 以 放 和 人 背包 的 物品 有 
nn 种 ,每 种 物品 只 有 一 个 ,重量 和 价值 分 别 为 w; ,vj (1 三 j 志 nn). 如 果 背 包 的 最 大 重量 限制 是 


1 十 nn 十 六 十 … 十 n= 二 


十 器 中 
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B, 问 怎样 选择 放 入 背包 的 物品 ,使 得 背包 的 价值 最 大 ? 
解 ”一 个 可 行 解 就 是 对 每 个 物品 的 选择 ,选择 其 是 放 入 背包 还 是 不 放 , 放 入 背包 就 标 


记 为 1, 不 放 就 标记 为 0. 这 样 , 所 有 可 行 解 是 满足 》 lwiz; 过 B 的 维 布尔 向 量 < xz， 


Zeyzue 这 ;其 中 zx; = 1 或 0(1 过 i 过 0). 
搜索 空间 的 每 片 树叶 对 应 了 物品 的 一 个 子 集 , 所 有 的 树叶 构成 集合 {二 zi ,zs ，… ,zx 二 | 


Zi 二 1 或 0,1 二 i<n) ,整个 搜索 空间 可 以 排 成 一 棵 完全 二 叉 树 . 对 于 每 个 内 结 点 来 说 ,到 达 
左 子 结 点 的 边 代表 1, 到达 右 子 结 点 的 边 代表 0. 这 样 的 完全 二 又 树 称 为 子 集 树 ,该 树 有 


2" 个 树叶 ,代表 了 选 人 物品 子 集 的 特征 序列 . 

搜索 策略 还 是 深度 优先 方法 . 下 面 以 一 个 实例 说 明 0-1 背包 问题 的 回溯 算法 的 运行 过 程 : 
设 n=4, 价 值 向 量 为 V={12,11,9,8} ,重量 向 量 为 W= 二 {8,6,4,3} ,背包 承载 量 为 B 一 13. 

按 深 度 优先 策略 ,从 根 结 点 开始 , 沿 着 边 zi 二 1 走 到 第 一 层 最 左边 的 那个 结 点 ,表示 第 
一 个 物品 被 选中 放 和 背包 ,此 时 ,背包 中 只 有 第 一 个 物品 ,其 重量 是 8, 不 超过 背包 承载 量 
13 ,可 以 继续 选择 . 于 是 搜索 按 深度 优先 策略 向 下 层 进行 . 算法 沿 着 x, 二 1 走 到 第 二 层 最 左 
边 的 那个 结 点 ,表示 第 二 个 物品 也 被 选中 放 入 背包 ,此 时 背包 中 物品 的 重量 达到 14, 大 于 背 
包 的 承载 量 , 破 坏 了 约束 条 件 ,回溯 到 父 结 点 . 接着 按 深度 优先 策略 沿边 zs 二 0 向 下 搜索 , 表 
示 第 二 个 物品 不 放 入 背包 ,此 时 背包 中 物品 重量 是 8, 还 可 以 继续 选择 物品 放 入 . 继续 沿 着 
左边 的 zs 一 1 走 到 其 左 儿 子 , 表 示 第 三 个 物品 被 选中 放 和 背包 ,此 时 背包 中 物品 的 重量 是 
12 ,小 于 承载 量 13. 继续 向 下 , 沿 着 zx, 二 1 走 到 其 左 儿 子 ,表示 第 四 个 物品 被 选中 放 和 人 背包， 
此 时 背包 中 物品 的 重量 将 达到 15, 大 于 承载 量 13, 破 坏 约束 条 件 ,回溯 到 父 结 点 . 于 是 算法 
只 能 沿 着 右边 的 x 二 0 走 到 其 右 儿 子 ,表示 第 四 个 物品 不 放 和 人 背包 ,此 时 背包 中 物品 的 重量 
是 12, 小 于 承载 量 13, 从 而 得 到 第 一 个 可 行 解 二 1,0,1,0 二 ,即将 第 1.3 个 物品 放 和 人 背包 ,第 
2、4 个 物品 不 放 , 此 时 放 入 背包 物品 的 价值 为 21, 现 在 还 不 知道 这 个 可 行 解 是 不 是 最 优 解 . 
如 此 下 去 ,算法 搜索 到 二 0.0,0,.0 二 结 点 以 后 ,将 沿 着 树 中 最 右边 的 路 径 逐 步 回 溯 ,直到 树 
根 ,算法 结束 ,如 图 5. 2 所 示 . 此 时 已 经 找到 了 所 有 的 可 行 解 ,所 有 这 些 价值 中 的 最 大 值 即 为 
最 优 值 ,对 应 的 解 即 为 最 优 解 . 在 这 个 实例 中 ,一 0.1.1,1 二 是 最 优 解 ,即将 第 2.3、4 个 物品 
放 入 背包 ,背包 中 物品 总 价值 最 大 达到 28. 


加 


下 


图 5.2 0-1 背包 问题 的 一 个 实例 


该 子 集 树 有 1 十 2 十 2 十 … 十 2" 二 2"+1 一] 之 2X2" 二 OC2") 个 结 点 . 在 每 个 结 点 处 要 计算 
放 入 背包 物品 的 重量 是 否 超 过 背包 的 承载 量 , 父 结 点 已 经 记录 了 在 此 结 点 之 前 已 放 入 背包 
物品 的 重量 ,再 加 上 当前 新 放 人 背包 物品 的 重量 ,就 可 得 到 该 结 点 处 放 和 人 背包 物品 的 重量 ， 
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在 最 坏 的 情况 下 .该 算法 只 进行 了 1 次 加 法 和 一 次 大 小 比较 , 即 进行 了 O(1) 次 运算 ,从 而 该 
算法 在 最 坏 的 情况 下 的 时 间 复 杂 性 为 0(2"). 

对 于 一 般 的 背包 问题 ,其 可 行 解 和 0-1 背包 问题 类 似 ,也 是 n 维 向 量 二 zi ,za ,zw 二 ， 
只 是 其 分 量 zx; 是 整数 ,不 一 定 只 是 0 或 1. 由 于 背包 承载 量 是 一 个 定 值 B, 所 以 第 i 种 物品 
放 和 人 背包 的 最 大 个 数 z; 满足 0 三 x; 二 LB/w; 」,1 二 in. 在 构造 解 空间 结构 时 , 根 结 点 的 分 支 
个 数 为 LB/ru 小 第 一 层 结 点 的 分 支 个 数 为 LB/ees 小 以 此 类 推 ,可 以 构造 完整 的 搜索 树 . 搜索 
策略 仍然 是 深度 优先 方法 ,此 处 略 . 

例 5.3 货 郎 问题 CTSP) 某 售 货 员 要 到 若干 城市 去 推销 商品 ,各 城市 之 间 的 距离 为 
已 知 . 他 要 选 定 一 条 从 驻地 出 发 经 过 所 有 城市 最 后 回 到 驻地 的 周游 路 线 , 使 得 总 的 路 程 最 
短 . 其 数学 模型 是 : 已 知 一 个 带 权 完全 图 ( 结 点 代表 城市 , 边 代表 城市 之 间 的 道路 , 权 代 表 城 
市 之 间 的 距离 ,如 两 个 城市 之 间 无 直接 连接 的 道路 , 设 其 权 为 2, 所 以 权 为 正 数 或 无 穷 ) , 求 
权 和 最 短 的 一 条 哈密 顿 回路 . 

货 郎 问题 中 , 带 权 图 又 可 分 为 有 向 图 和 无 向 图 。 下 面 算 法 对 有 向 图 和 无 向 图 都 适用 . 

解 一 个 可 行 解 是 n 个 城市 的 一 个 排列 ,排列 的 第 一 个 元 素 是 售货员 的 驻地 。 最 后 一 
个 元 素 是 其 最 后 周游 的 城市 ,由 此 城市 又 回 到 驻地 . 如 果 将 城市 编号 为 1,2,…,n, 且 驻地 为 
城市 1, 则 一 个 可 行 解 即 为 首 元 素 是 1 的 一 个 元 排列 . 

这 些 排列 可 以 安排 成 如 下 的 搜索 树 , 从 根 到 叶 结 点 的 一 条 路 径 对 应 了 (1,2,…,n) 的 排 
列 , 根 结 点 只 有 一 个 子 结 点 ,其余 各 结 点 分 支 数 不 同 . 第 一 层 结 点 有 n 一 1 个 分 支 ,第 二 层 结 
点 有 nn 一 2 个 分 支 ,…, 第 2 一 1 层 有 1 个 分 支 ,这 样 的 树 称 为 排列 树 . 

搜索 策略 依然 是 深度 优先 . 
图 5. 3 的 右边 给 出 货 郎 问题 的 一 个 实例 ,其 对 应 的 搜索 树 为 左边 的 排列 树 . 按 深度 优先 
策略 ,可 求 出 最 优 解 为 : 二 1,2,4,3 二 ,对 应 于 巡回 路 线 : 1 一 2 一 4 一 3 一 1, 巡 回路 径 的 长 度 
为 5 十 2 十 7 十 9 一 23. 


图 5.3 货 郎 问题 的 一 个 实例 


该 排列 树 有 开 , 王 1 十 1 十 (2 一 1) 十 (2 一 1)(2 一 2) 十 … 十 ((2 一 1) (2 一 2)…2) 十 (2 一 1)1 
个 结 点 . 而 


1 1 1 1 
昌国 1 | 
人 Wi (6 Di i Ey 一 1) 
妆 烛 她 D1x (到 :+H+…+ 寺 +1+1] 


<1+o-Dltx| 二 +] 


2 
i+ = 1 
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而 在 每 个 结 点 处 要 计算 已 得 到 的 路 径 长 度 , 这 只 要 将 父 结 点 得 到 的 路 径 长 度 加 上 父 结 
点 到 本 结 点 的 距离 即 可 ;在 叶 结 点 处 还 要 计算 得 到 的 回路 长 度 ,并 判断 得 到 的 回路 是 否 为 当 
前 的 最 短 回路 ,所 以 算法 在 每 个 结 点 处 最 多 进行 两 次 加 法 和 一 次 大 小 比较 , 故 该 算法 最 坏 情 
形 的 时 间 复 杂 性 为 O(n 一 1)1)X0(1)=0((n 一 1)1). 

由 这 些 例子 可 以 看 出 回溯 算法 的 共同 特征 : 

(1) 可 求解 搜索 问题 和 优化 问题 ,搜索 问题 可 定义 如 下 : 

一 个 搜索 问题 x 有 实例 集 Dx, 对 于 x 中 的 任何 实例 I, 有 一 个 有 穷 的 解 集合 S:[ 了]. 

如 果 存 在 算法 A, 对 于 任何 实例 TE Dx,A 都 停止 ,并 且 如 果 Sr[ 刀 = 外 , 则 回答 无 解 ， 
否则 给 出 Sx[ 慧 中 的 一 个 解 ,那么 称 A 解 搜索 问题 x. 

(2) 搜索 空间 是 一 棵 树 ,每 个 结 点 对 应 了 部 分 向 量 ,满足 约束 条 件 的 树叶 对 应 了 可 行 
解 , 在 优化 问题 中 不 一 定 是 最 优 解 . 

(3) 搜索 过 程 一 般 采 用 深度 优先 、 宽 度 优 先 、 函 数 优先 或 宽 深 结合 等 策略 隐 含 遍历 搜索 
树 . 所 谓 隐 含 遍历 是 指 : 不 是 真正 访问 到 每 个 结 点 ,需要 从 搜索 树 中 进行 裁减 . 

(4) 判定 条 件 ( 分 支 与 回溯 条 件 ): 满足 约束 条 件 则 分 支 扩 张 解 向 量 ;不 满足 约束 条 件 ， 
回溯 到 该 结 点 的 父 结 点 . 


5.1.2 回 湖 算 法 的 适用 条 件 


要 使 回溯 算法 得 到 正确 应 用 ,必须 满足 如 下 的 多 米 诺 性 质 : 
假设 P(xi ,zz，… ,zx;) 是 关于 向 量 二 xz ,zs，… ,zi; 记 的 某 个 性 质 ( 例 如 例 5. 1 中 的 前 i 个 皇 
后 放置 在 彼此 不 能 攻击 的 位 置 ) ,那么 ,PCzm ,zo，… ,iri) 为 真丝 涵 PCzm ,zo，…,xi) 为 真 , 即 
Priszars Ta) > Prisrases i) (0<kn) 
其 中 代表 解 向 量 的 维 数 . 
下 面 是 一 个 不 满足 多 米 诺 性 质 .因而 使 用 回溯 算法 不 能 得 到 正确 解 的 一 个 反例 . 
例 5.4 求 满足 下 列 不 等 式 的 所 有 整数 解 : 
5z1 十 47s 一 zs 魏 10 
1<z<3, i=1,2,3 
P(ri,xs，… ,Xk) 表 示 将 zz ,ze 代入 原 不 等 式 的 相应 部 分 使 得 左边 小 于 等 于 10， 
如 P(zi ,zs ,zs) 表 示 5zi 十 4zs 一 Xs 三 10. 存在 二 zi ,xs ,zs 二 一 一 1,2,3 二 使 得 PCzl ,zz zs) 
为 真 ,但 是 P(x zz) 表示 5z 十 4zs 生 10, 显 然 为 假 , 因 而 忆 不 满足 多 
米 诺 性 质 , 不 能 使 用 回溯 算法 . 如 果 使 用 回溯 算法 ,其 执行 过 程 是 : 
搜索 空间 是 {过 zxi ,x ,zs 二 11] 委 zi 委 3,i 一 1,2,3} ,是 一 棵 完全 3 
又 树 , 如 图 5.4 所 示 . 搜索 策略 还 是 深度 优先 . 
回溯 算法 很 容易 求 出 二 1,1,1 二 、 二 1,1,2>、 二 1,1,3 二 是 其 解 ， 
图 5.4 不 等 式 求解 ”但 当 算法 搜索 到 结 点 A 时 ,zi 一 1,zs 二 2, 此 时 5zi 十 4zs 一 13 之 10， 
的 搜索 柑 不 满足 条 件 , 算 法 将 回 湖 到 其 父 结 点 ,进而 搜索 结 点 B, 从 而 丢掉 
去 1,2,3 二 这 个 解 . 如 果 令 zx 一 4 一 za ,那么 不 等 式 将 改 为 : 
5z 十 4zs 十 zs 二 14 
Me ms me B= 
则 该 不 等 式 满足 多 米 诺 性 质 , 可 以 使 用 回溯 算法 . 对 所 得 到 的 解 zi ,xs.zs 很 容易 地 转换 成 
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原来 不 等 式 的 解 zi ,za ,za. 
回溯 算法 中 , 结 点 状态 随 算法 的 进行 会 改变 , 结 点 一 般 有 三 种 状态 : 白 结 点 (尚未 访 
问 ) 、 灰 结 点 (正在 访问 以 该 结 点 为 根 的 树 中 结 点 ) 、 黑 结 点 (该 结 点 为 根 的 子 树 遍 历 完成 ) 。 


5.2 ”回溯 算法 的 设计 步骤 


回溯 算法 设计 的 主要 步骤 如 下 : 

(1) 定义 搜索 问题 的 解 向 量 和 每 个 分 量 的 取 值 范围 . 

(2) 确定 子 结 点 的 排列 规则 . 

(3) 判断 是 否 满足 多 米 诺 性 质 . 

(4) 确定 搜索 策略 : 深度 优先 、 宽 度 优先 、 宽 深 结合 等 . 

(5) 确定 每 个 结 点 能 够 分 支 的 约束 条 件 . 

(6) 确定 存储 搜索 路 径 的 数据 结构 . 

回溯 算法 一 般 可 以 如 下 描述 : 设 解 向 量 为 二 zz …'z 二 ,zi 的 可 能 取 值 的 集合 为 
Xi，i 一 1,2,…,. 设 当 zz ,zt 确定 以 后 zx 的 取 值 集合 为 Se, 显然 SEX 回溯 算 
法 的 实现 可 以 有 两 种 方法 : 递归 回溯 和 和 迭代 递归 . 下 面 给 出 算法 的 伪 码 . 


5.2.1 回 滴 算 法 的 遂 归 实现 和 迭代 实现 


算法 5.1 ReBack(k) 

1. ff kn” then 二 zi .x2，"… zw 二 是 解 
2. else while SO do 

3, za 一 Ss 中 最 小 值 
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六 Si Si— {zs} 
入 计算 Si 
6 ReBack(k+1) 


算法 5.2 递归 回溯 ReBacktrack(n) 
输入 : 7 

输出 : 所 有 的 解 

1. for i<-1 to n do 计算 入 

2. Si 二 

3. ReBack(1) 


算法 5.3 和 迭代 回溯 Backtrack(n) 
输入 : 7 

输出 : 所 有 的 解 

1. 对 于 ;一 1,2,…, 确 定 X， 
| 

3. 计算 5 

4. while SO do 
5 ze 一 Ss 中 最 小 值 ; SS 一 {zx} 
6 if kn then 

沈 A< 十 1; 计算 Ss 
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E else 二 zi ,Xs，… ,ZX, 二 是 解 
9. ifk>1 then k<k—l1;goto 4 


以 4 皇后 问题 为 例 , 上 述 算法 执行 的 部 分 过 程 如 下 : 


初始 : Xi 二 Xs 二 Xs 二 入 二 {1,2,3,4}. 

二 1,S1 二 {1,2,3,4), 取 汉 = 二 1, 修 改 Si 二 {12,3,4). 
2,S: 一 {3,4}, 取 zs 二 3, 修改 S: 一 {4)}. 
3,S: 一 人 ,回溯 . 

2,S: 一 {4}, 取 zz 一 4, 修 改 S: 一 分 . 
3,.S: 一 {2}, 取 zs 一 2, 修 改 S: 一 人 
4,Si 一 思 , 回 溯 . 
3,S: 一 人 ,回溯 . 

一 2,S: 一 人 ,回溯 . 
1 
2 
3 
4 
3 
2 
1 


,51 二 {2,3,4), 取 zx! 二 2, 修 改 Si 一 {3,4} 
,S: 一 {4}, 取 zz 一 4, 修 改 S: 一 人 . 
3,S5; 二 {1), 取 zs 二 1, 修 改 S: 一 分. 
,S, 二 {3}, 取 zz, 二 3, 修 改 S, = 人 @, 得 到 解 二 2,4,1,3 二 . 
，S; 二 人 @, 回 溯 . 
，S: 一 何 , 回 漳 . 
,Si 一 {3,4}, 取 六 一 3 修改 Si 一 (14}. 


上 面 描述 了 算法 在 左 子 树 中 的 执行 情况 ,后 面 右 子 树 的 过 程 与 前 面 类 似 , 不 再 重复 . 下 
面 给 出 几 个 典型 的 回溯 算法 例子 . 


5.2.2 几 个 典型 的 例子 


例 5.5 装载 问题 : n 个 集装箱 装 上 两 艘 载重 分 别 为 c; 和 cs 的 轮船 ,wi 为 集装箱 i 的 
重量 , 且 
站 is 去 cl 十 cz 


问 是 否 存 在 一 种 合理 的 装载 方案 将 n 个 集装箱 装 上 轮船 ? 如 果 有 ,给 出 一 种 方案 . 

解 可 以 证 明 : 如 果 装 载 问题 有 解 , 则 存在 一 个 使 得 第 一 条 船 装载 量 与 c, 的 差 达 到 最 
小 的 解 . 从 而 有 如 下 解 题 思路 : 

(1) 用 回溯 算法 确定 使 第 一 条 船 装载 量 Wi 与 a 的 差 达到 最 小 的 装载 方案 二 zx， 
zs， ,Ts 记 ， 即 使 得 第 一 条 船 装载 量 达到 最 大 值 W, 的 装载 方案 ; 


(2) 如 果 >) wi 一 Wi 三 cs, 则 回答 Yes, 和 否则 回答 No. 
i=l 


算法 设计 步骤 如 下 : 
(1) 解 向 量 是 二 zi ,zz ,zs 二 ,其 中 心 E{11.0},1 委 i 委 2 搜索 空间 是 子 集 树 . 
(2) 在 结 点 二 zi zz,… ,x 二 的 约束 条 件 : 


k 
S zi Sc 
i=1 
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击 吕 器 


大 
(3) 满足 多 米 诺 条 件 : 令 PCzi za,… ,zi) 为 >) wizi 之 cl, 从 而 


上 | 
当 wiri > a=> 2 Ti > cl 

(4) 搜索 策略 : 深度 优先 . 

上 述 回 溯 算 法 的 伪 码 如 下 : 其 中 B 为 目前 空隙 ,best 为 目前 为 止 最 优 解 的 空隙 . 


算法 5.4 Loading(W,c1)， 
输入 : 集装箱 重量 WW 二 二 wn ,ze ,… ,rw 记 ,cl 是 第 一 条 船 的 载重 
输出 : 使 得 第 一 条 船 装载 量 最 大 的 装载 方案 二 mi ,zz ，… ,zx, 记 ,其 中 zx; 二 0,1 
1. Bec best< -clii ti-1 
while i<n do 
让 装 入 i 后 重量 不 超过 cc 
then BB—vw; zx[i]<1; i<-i+]1 
else x[i]<03 i<-i+1 
计 B<best then 记录 解 ;best 呈 B; i<-i 一 1 
Backtrack (iD) 
让 i 二 1] then return 最 优 解 


else goto 3 


各 全 和 


算法 5.5 Backtrack(i) 

1. while i>1 and zx[i]=0 do 

监 。 下- // 回 溯 到 父 结 点 

3. if xz[i]=1 then x[i]<0; BB+w; ii 十 1 // 搜 索 右 分 支 

我 们 以 如 下 实例 说 明 算 法 执行 过 程 .实例 : W 二 二 90,80,40,30,20,12,10 ,a 二 152， 
c 一 130. 回溯 算法 使 用 深度 优先 搜索 策略 ,搜索 过 程 如 图 5. 5 所 示 . 虚 
线 表示 回溯 . 算法 首先 给 出 第 一 个 可 行 解 <1,0.1.0.1,0,0 二 ,其 装载 中 
量 为 150, 但 其 后 给 出 第 二 个 可 行 解 二 1,0,1,0,0,1,1 二 ,其 装载 量 为 30 
152 ,恰好 为 第 一 条 船 的 承载 量 ,因而 也 是 最 大 的 装载 量 . 第 一 条 船 装载 “ 
后 ,货物 剩 下 的 重量 为 80 十 30 十 20 一 130, 正 好 可 装 入 第 二 条 船 . 所 以 本 .2 , 
实例 的 解 为 : 第 1.3.6.7 集装箱 装 和 人 第 一 条 船 , 第 2、4、5 集装箱 装 和 人 第 
二 条 船 . 图 5.5 装载 问题 

在 最 坏 的 情况 下 ,算法 要 遍历 图 中 几乎 所 有 的 点 , 叶 结 点 有 的 实例 
2" 个 , 结 点 总 数 为 0(2") 个 . 每 个 结 点 要 计算 装载 量 以 判定 是 否 回溯 ， 
达到 叶 结 点 的 计算 时 间 为 O(1) ,所 以 算法 的 计算 时 间 复 杂 度 为 0(2"). 

例 5.6 图 的 m 着色 问题 .给 定 无 向 连通 图 G 和 wm 种 颜色 .用 这 些 颜 色 给 图 的 顶点 着 
色 , 每 个 顶点 一 种 颜色 . 如 果 要 求 G 的 每 条 边 的 两 个 顶点 着 不 同 颜色 . 给 出 所 有 可 能 的 着 色 
方案 ;如 果 不 存在 着 这 样 的 方案 , 则 回答 “No”. 

解 设 G 有 nn 个 顶点 ,将 顶点 编号 为 1,2,…,.n, 则 搜索 空间 为 深度 nn 的 m 又 完全 树 . 将 
颜色 编号 为 1,2,… ,m, 树 的 结 点 二 zi ,x2 ,T(xiyx2s TE{l,2,.…,m}),1<kSn) 
表示 顶点 1 着 颜色 zi ,顶点 2 着 颜色 xz,.…, 顶 点 & 着 颜色 工 ,. 

约束 条 件 : 该 顶点 邻接 表 中 已 着 色 的 顶点 与 该 顶点 没有 同色 的 ; 
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搜索 策略 : 深度 优先 。 

图 5.6 给 出 了 一 个 图 着 色 的 实例 ,其 中 顶点 数 n 二 7, 颜 色 数 mm 二 3. 按照 1.2.3,4,5,6， 
7 顺序 构造 搜索 树 . 按 深度 优先 策略 可 以 得 到 第 一 个 着 3 色 方案 (图 中 粗 线路 径 所 示 ) 是 : 顶 
点 1.3 和 5 着 色 1; 顶 点 2 和 6 着 色 2; 顶 点 4 和 7 着 色 3. 在 二 1,2 过 的 路 径 上 只 有 这 一 个 可 
行 解 . 在 二 1,3 之 的 路 径 上 也 只 有 一 个 可 行 解 : 顶点 1.3 和 5 着 色 1; 顶 点 4 和 7 着 色 2; 顶 点 
2 和 6 着 色 3. 其实 这 个 解 只 是 将 第 一 个 解 中 的 颜色 2 和 颜色 3 交换 而 已 . 根据 对 称 性 ,在 这 
棵 树 中 只 需 搜索 1/3 的 空间 即 可 ,搜索 算法 共 可 得 到 6 个 解 . 


6 
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图 5.6 一 个 图 着 色 问 题 的 实例 
该 搜索 树 中 有 
1 十 mw 十 mw 十 … 十 m” 和 过 人 2m" (m 宇 2) 
2 
个 结 点 ,在 每 个 结 点 处 要 判断 当前 顶点 的 着 色 与 已 着 色 的 顶点 是 否 颜色 冲突 ,最 坏 情 况 下 与 


其 他 所 有 顶点 的 颜色 都 要 进行 比较 , 即 进行 n 一 1 次 比较 , 故 该 算法 在 最 坏 情 况 下 的 时 间 复 
杂 性 为 O(nm”). 


5.3 ”回溯 算法 的 效率 估计 和 改进 途径 


回溯 算法 的 时 间 复 杂 度 一 般 取 决 于 在 搜索 空间 中 真正 遍历 的 结 点 个 数 以 及 在 每 个 结 点 
的 工作 量 ,而 结 点 个 数 通常 是 指数 量 级 . 在 最 坏 的 情况 下 ,算法 的 裁剪 策略 几乎 没有 用 处 , 往 
往 需 要 遍历 整个 搜索 空间 ,而 平均 情况 下 算法 的 复杂 度 比 起 蛮 力 算法 会 好 一 些 .为 了 估计 算 
法 运行 的 效率 ,可 以 用 在 搜索 树 中 真正 遍历 的 结 点 数 作 为 度量 标准 ,通常 采用 概率 方法 中 的 
蒙特 卡 罗 (Monte Carlo) 方 法 来 做 出 估计 . 从 根 开始 ,算法 在 每 个 结 点 从 所 有 可 行 的 分 支 中 
随机 选择 一 个 分 支 . 当 算 法 最 终 到 达 某 片 树叶 ,就 得 到 一 条 随机 选择 的 路 径 . 把 其 他 的 路 径 
按照 这 条 路 径 的 形式 进行 复制 ,从 而 生成 一 棵 对 称 的 树 ,以 这 棵 树 的 结 点 数 作为 本 次 遍历 的 
结 点 数 的 估计 . 图 5.7 给 出 了 一 个 4 皇后 问题 的 估计 . 假若 算法 某 次 抽样 的 路 径 是 二 1,4,2 二 . 
在 根 结 点 ,Si 一 {1,2,3,4) ,因此 根 有 4 个 儿子 ,这 棵 树 第 一 层 的 4 条 路 径 与 1,4,2 二 具有 
相同 的 结构 . 当 第 二 次 随机 选择 时 ,S, 二 13.4)}, 有 两 种 选择 ,因此 第 二 层 的 每 个 结 点 都 有 
2 个 分 支 . 当 算 法 选择 了 4 之 后 ,下 一 步 进行 第 三 次 随机 选择 时 ,S; 二 {2), 这 时 算法 只 有 一 
种 选择 ,这 意味 着 该 结 点 只 有 1 个 分 支 , 只 能 到 达 二 1,4.2 二 结 点 . 因此 ,这 棵 树 的 第 三 层 的 
每 个 结 点 都 是 1 个 分 支 . 到 此 为 止 ,最 终 形成 的 树 就 是 在 图 5.7 中 标记 为 二 1,4,2 之 的 树 . 类 
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似 地 ,如 果 随 机 选择 的 路 径 是 二 1,3 之 和 二 2,4.1,3 二 ,可 以 得 到 图 中 的 另外 两 棵 树 . 而 算法 
真正 遍历 的 树 就 是 搜索 空间 所 表示 的 树 . 在 多 次 抽样 中 ,每 次 形成 的 树 可 能 是 二 1,4,2 二 ， 
去 1,3 二 和 所 2.4,1,3 之 这 三 种 树 之 一 . 对 每 次 抽样 得 到 的 树 的 结 点 数 取 平均 值 ,就 得 到 一 个 
平均 情况 下 算法 真正 遍历 结 点 数 的 估计 值 . 


rRNA 


抽样 <1, 4, 2> 抽样 <1, 3> 
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抽样 <2, 4, 1, 3> 搜索 树 
图 5.7 4 皇后 问题 的 Monte Carlo 估计 


设 1 为 取样 次 数 ,sum 为 上 次 取样 遍历 结 点 的 平均 数 ,m 为 本 次 取样 树 中 结 点 总 数 , 为 
目前 访问 结 点 的 层 数 ,ri 为 在 路 径 中 的 本 层 分 支 数 ,rs 为 路 径 中 的 上 层 分 支 数 ,n 为 树 的 层 
数 . 下 面 的 伪 码 给 出 上 述 估计 方法 的 算法 . 


算法 5.6 Monte Carlo 
输入 : nw 为 正 整 数 ,n 为 皇后 数 ,i 为 抽样 次 数 
输出 : sumwt 次 抽样 平均 访问 的 结 点 数 


1. sum<—0 

2. for i<-l1 tot do 

卖 m=<—Estimate(n) //Estimate(n) 是 第 i 次 抽样 得 到 的 树 中 结 点 数 
1 Sum<—sum+m 
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.Sum=<—sum/t 


算法 5.7 Estimate(n) 
1.m<1; ra<l; -1 
2. While k<n do 


3. if S 一 思 then return m 


4. nlS|*r // 计 算 第 & 层 的 结 点 数 

5. mm+trn // 第 上 层 以 上 各 层 的 结 点 总 数 
6. zr 一 随机 选择 Se 的 元 素 

1. ran 

8. A< 十 1 


例 5.7 4 皇后 问题 的 Monte Carlo 估计 .抽样 的 路 径 有 以 下 3 种 ,其 生成 的 树 中 结 点 
数 分 别 为 : 

(1) =1,4,2>: 1 十 4 十 4X2 十 4X2 一 21 

(2) <2,4,153>;: 4X3++1=17 

(3) =1,3>: 1+4X1+4X2=13 
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如 果 4 次 抽样 中 ,情况 1 出 现 1 次 ,情况 2 出 现 1 次 ,情况 3 出 现 两 次 ,那么 树 中 的 平均 结 点 
数 为 : 
(13X2 十 21 十 17)/4 = 16 

而 算法 真正 访问 的 结 点 数 如 图 5.7 中 的 搜索 树 所 示 ,等 于 17. 
回溯 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 函数 为 W(n) 二 OC(p(n)*f(n)), 其 中 : p(n) 为 每 
个 结 点 的 计算 时 间 ,/(7) 为 结 点 个 数 , 通 常 为 输入 规模 n 的 指数 函数 . 这 就 为 我 们 提供 了 分 
析 影 响 回 溯 算 法 效率 的 因素 和 改进 算法 的 途径 . 
影响 回溯 算法 效率 的 因素 : 
) 搜索 树 的 结构 : 如 分 支 情况 . 树 的 深度 . 

(2) 解 的 分 布 : 如 解 在 树 中 是 否 均 匀 分 布 以 及 深度 等 . 

(3) 约束 条 件 的 计算 复杂 性 . 
由 此 得 出 改进 回溯 算法 的 下 述 途径 : 

(1) 根据 树 的 分 支 情况 设计 优先 策略 ,如 结 点 少 的 分 支 优先 搜索 , 解 多 的 分 支 优先 搜 

(2) 利用 搜索 树 的 对 称 性 裁剪 子 树 . 

(3) 分 解 为 子 问题 , 先 搜索 子 问题 ,然后 组 合子 问题 的 解 . 假设 遍历 整个 搜索 空间 需要 
c2" 时 间 ,如 果 分 解 为 A 个 子 问 题 ,每 个 子 问 题 大 小 为 zw, 则 求解 时 间 为 ec2"% 十 工 ,其 中 工 
为 组 合子 问题 的 时 间 . 如 果 工 不 超过 O(2”) ,那么 算法 的 时 间 复 杂 度 就 有 了 明显 的 改进 . 


5.4 分 支 限 界 


分 支 限界 是 回溯 算法 的 变种 ,用 于 求解 组 合 优化 问题 . 下面 以 优化 问题 中 的 极 大 化 问题 
为 例 来 说 明 分 支 限界 的 设计 思想 . 

为 加 快 裁 前 (回溯) 的 速度 ,需要 更 多 的 约束 条 件 . 约束 条 件 越 多 ,不 满足 约束 条 件 的 可 
能 性 就 越 大 ,回溯 的 机 会 就 越 多 ,裁剪 的 分 支 数 就 越 多 ,从 而 算法 更 快 . 为 建立 新 的 约束 条 
件 ,我 们 定义 两 个 新 函数 : 代价 函数 和 界 函数 . 

代价 函数 的 定义 域 是 搜索 树 中 所 有 结 点 构成 的 集合 ,函数 值 的 直观 含义 是 : 当 搜索 进 
行 到 此 结 点 时 ,以 后 无 论 怎么 选择 此 结 点 的 后 代 , 目 标 函 数 所 能 达到 的 最 大 值 不 会 超过 代价 
函数 的 值 .严格 地 说 ,代价 函数 在 某 结 点 的 函数 值 是 以 该 结 点 为 根 的 子 树 中 ,所 有 叶 结 点 对 
应 的 可 行 解 的 目标 函数 值 的 一 个 上 界 . 因而 对 于 极 大 化 组 合 优化 问题 ,代价 函数 在 父 结 点 的 
值 大 于 或 等 于 在 子 结 点 的 值 . 

界 函 数 的 定义 相对 简单 ,其 定义 域 也 是 搜索 树 中 所 有 结 点 构成 的 集合 ,其 图 数值 是 搜索 
到 此 结 点 时 已 经 得 到 的 可 行 解 的 目标 函数 的 最 大 值 . 

当 回溯 算 法 搜索 到 某 结 点 时 .如果 代价 函数 的 函数 值 小 于 界 函 数 的 函数 值 , 则 在 搜索 该 
结 点 的 后 代 时 ,所 找到 的 可 行 解 的 目标 函数 值 不 可 能 比 界 函数 值 更 大 , 即 不 可 能 找到 更 优 
的 解 . 
因而 我 们 可 以 增加 新 的 条 件 一 一 代价 函数 值 大 于 界 函 数值 来 加 快 回溯 . 由 此 得 到 如 下 
分 支 限 界 算法 的 基本 思想 : 

(1) 设立 代价 函数 ,具有 如 下 性 质 : 函数 值 是 以 该 结 点 为 根 的 搜索 树 中 的 所 有 可 行 解 
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的 目标 函数 值 的 上 界 ; 易 见 父 结 点 的 代价 大 于 等 于 子 结 点 的 代价 . 

(2) 设立 界 , 其 值 是 当时 已 经 得 到 的 可 行 解 的 目标 函数 的 最 大 值 . 

(3) 搜索 中 停止 分 支 的 依据 : 如 果 某 个 结 点 不 满足 约束 条 件 或 者 其 代价 函数 小 于 当时 
的 界 函 数 , 则 不 再 分 支 ,向 上 回溯 到 父 结 点 . 

(4) 界 的 更 新 : 如 果 目 标 函 数值 为 正 数 , 初 值 可 以 设 为 0. 在 搜索 中 如 得 到 一 个 可 行 解 ， 
计算 可 行 解 的 目标 函数 值 ,如 果 这 个 值 大 于 当时 的 界 ,就 将 这 个 值 作为 新 的 界 . 

对 于 极 小 化 问题 ,将 上 述 内 容 进 行 对 偶 即 可 , 即 在 上 述 基 本 思想 中 将 “上 界 ? 改 为 "下 
界 ”,“ 大 于 ” 改 为 “小 于 ”,“ 最 大 值 ” 改 为 “最 小 值 ”. 


5.4.1 背包 问题 


下 面 以 背包 问题 为 例 说 明 分 支 限 界 算法 的 具体 过 程 . 
例 5.8 以 下 为 背包 问题 的 一 个 实例 : 
mi tn Bs Sins 4 9 
2 ef | 
Xx:EN, i=1,2,3,4 
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解 ” 对 变 元 zi ,za ,za zs 按 _- 之 忆 于 重新 排序 ,得 到 该 问题 的 另 一 种 描述 : 

max 9 十 5z 4 3 二 74 

tm hs 32 a 0 

Xi:EN, i=1,2,3,4 
搜索 空间 洲 ( 过 wisamami 宇 | .wi EMO 和 0S 和 0 
5). 搜索 树 如 图 5. 8 所 示 . 直观 地 说 , 结 点 二 ,zs，… ,xs 记 的 代价 函数 值 为 : 在 


下 无论 za ,sz 取 何 值 , > wzi 的 一 个 上 界 . 具体 地 ,可 


取 此 上 界 为 
ywies + (5— Dy wi ) 若 对 某 个 了 之 上 有 4 一 > ruiri > wi 
i=1 i=1 k+l1 jn 
miti 否则 


上 


大 

> viz; 表示 已 放 入 背包 中 物品 的 价值 , (5 一 > wizi ) 表 示 背 包 剩 下 的 空 阶 重量 ,如 果 这 些 
i=1 i=l 

空隙 还 能 放下 & 十 1 种 物品 或 以 后 的 某 种 物品 , 即 存在 某 个 ) > 使 4 一 >)wiz; 宇 vw), 则 这 
些 空隙 能 达到 的 最 大 价值 为 (4 一 Du ) 于 于， 因为 在 剩 下 物品 中 ,单位 重量 价值 最 大 的 


位 重 
是 第 k 十 1 种 物品 . 如 这 些 空隙 放 不 下 & 上 1 种 物品 或 以 后 的 任何 物品 品 , 则 这 些 空隙 能 达到 的 


最 大 价值 为 ui。 
界 函数 在 结 点 一 ri,zrz ,…:,zt 二 处 的 函数 值 是 在 此 结 点 之 前 已 经 找到 的 方案 中 , 放 和 人 背 
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包 物 品 的 最 大 总 价值 . 初始 值 为 0, 随 着 搜索 进行 更 新 . 
背包 问题 的 搜索 策略 还 是 采用 深度 优先 策略 ,分支 限 界 过 程 如 图 5. 8 所 示 . 圆 结 点 中 的 
代表 代价 函数 的 值 ,w 代表 此 时 放 入 背包 物品 的 总 重量 . 


图 5.8 在 背包 问题 使 用 分 支 限界 技术 


在 根 结 点 处 ,背包 中 无 任何 物品 ,所 以 背包 中 物品 的 总 重量 为 0. 此 时 代价 函数 值 为 
10X(9/7), 界 函数 的 值 为 初始 值 0, 背 包 中 物品 的 总 重量 小 于 承载 量 , 代 价 函 数值 大 于 界 函 
数值 ,所 以 按 zx 的 取 值 范围 继续 分 支 . 由 于 0 二 1, 所 以 根 结 点 有 2 个 分 支 ,左边 为 x 一 
1, 右 边 为 x 二 0. 按 深 度 优先 策略 ,下 一 步 搜索 第 一 层 的 左 结 点 . 

在 第 一 层 左 结 点 处 ,由 于 zi 一 1, 表 示 背 包 中 放 和 了 1 个 1 号 物品 ,此 时 背包 中 物品 的 
总 重量 为 7, 代 价 函 数值 为 9 十 3X (5/4), 界 函数 值 仍然 为 0, 没 有 违反 任何 条 件 , 所 以 按 
zs 的 取 值 范围 继续 分 支 . 由 于 0 二 xs 夺 2, 故此 结 点 有 3 个 分 支 ,分 别 为 zs 二 2,xs 二 1 和 zx; 二 


在 第 二 层 最 左边 的 结 点 ,由 于 背包 中 放 入 了 1 个 1 号 物品 和 2 个 2 号 物品 ,此 时 背包 中 
物品 的 总 重量 为 15 ,违背 了 约束 条 件 . 于 是 回溯 至 父 结 点 . 继续 搜索 ,进入 第 二 层 左 边 第 二 
个 结 点 ,此 时 背包 中 放 入 了 1 个 1 号 物品 和 1 个 2 号 物品 ,背包 中 物品 的 总 重量 为 11 ,还 是 
违背 了 约束 条 件 , 于 是 又 回溯 . 继续 搜索 进入 第 二 层 左 边 第 三 个 结 点 ,如 此 继续 下 去 …… 

在 图 5. 8 中 的 黑 方 框 结 点 处 ,背包 中 放 入 了 1 个 1 号 物品 和 1 个 3 号 物品 ,此 时 背包 中 
物品 的 总 重量 为 10, 代 价 函 数值 为 (9 十 3) 十 0X (1/2)= 二 12, 界 函数 值 仍然 为 0, 没 有 违反 任 
何 条 件 , 所 以 按 zs 的 取 值 范围 继续 分 支 . 由 于 0 三 xs 三 5, 故 此 结 点 有 6 个 分 支 ,分 别 为 zx, 二 
5,… ,4 二 1 和 zx, 二 0. 按 深度 优先 策略 ,下 一 步 搜索 第 四 层 中 最 左边 的 结 点 . 由 于 此 时 背包 
中 的 空 际 为 0, 已 不 能 放 入 任何 物品 。 所 以 它 的 子 结 点 中 只 有 x 二 0 处 是 可 行 解 , 即 在 
二 1,0,1,0 二 处 是 可 行 解 . 

在 二 1.0,1,0 二 处 ,得 到 了 第 一 个 可 行 解 ,此 时 背包 中 物品 的 总 重量 为 10, 代 价 函 数值 
仍然 为 (9 十 3) 十 0X (1/2) 二 12, 但 界 函 数值 更 新 为 背包 中 物品 的 价值 , 即 12. 此 时 已 到 叶 结 
点 ,于 是 回溯 到 父 结 点 . 

搜索 继续 进行 ,下 一 步 进 入 结 点 过 1.0,0 二 :在 此 处 背包 中 物品 的 总 重量 为 7( 只 放 和 人 了 
1 个 1 号 物品 ) ,代价 函数 值 为 9 十 3X(1/2) 二 10.5, 界 函数 值 为 12,. 代 价 函 数值 小 于 界 函 数 
值 . 于 是 回溯 . 
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算法 搜索 的 最 后 三 个 结 点 分 别 是 第 二 层 结 点 的 右边 三 个 ,它们 的 代价 函数 值 分 别 为 
12、11 和 10, 界 函数 值 都 为 12 ,不 小 于 代价 函数 值 , 因 而 往 下 搜索 也 得 不 到 更 优 的 解 . 于 是 
遍历 完成 ,算法 结束 ,得 到 一 个 最 优 解 二 1,0.1.0 二 ,最 优 值 为 12. 


5.4.2 最 大 团 问 题 


例 5.9 最 大 团 问题 给 定 无 向 图 G 王 <V.E>.G 的 一 个 完全 子 图 就 称 为 G 的 一 个 团 . 
求 G 中 的 一 个 最 大 团 , 即 G 的 顶点 个 数 最 多 的 团 . 

解 ” 搜 索 树 为 子 集 树 . 解 二 zzz,…vz 二, 其中: x;= 二 0 或 1,1 二 i 过 nn. 结 点 二 xz， 
Z2，"……* ,Xk 记 , 表 示 检 索 过 k 个 顶点 ,其 中 xz; 二 1 表示 对 应 的 顶点 在 当前 的 团 内 . 

约束 条 件 : 该 分 支 结 点 对 应 的 顶点 与 当前 团 内 每 个 顶点 都 有 边 相连 . 

界 : 当前 图 中 已 检索 到 的 极 大 团 的 顶点 数 . 

代价 函数 下 : 以 目前 的 团 为 基础 扩张 为 极 大 团 的 顶点 数 的 上 界 . 设 c 为 目前 形成 的 团 
的 顶点 数 (初始 为 0) ,& 为 目前 检索 的 子 集 树 的 结 点 的 层 数 , 即 已 经 检索 过 的 顶点 数 , 剩 下 未 
检索 的 顶点 数 为 n 一 k, 在 某 结 点 处 所 能 达到 的 极 大 团 最 多 是 将 剩 下 的 顶点 全 部 加 入 已 有 的 
团 中 (条 件 是 这 样 能 形成 团 ) ,这 样 的 团 的 顶点 数 不 会 超过 已 有 的 团 的 顶点 数 与 剩 下 顶点 数 
的 和 , 即 
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F=c+n—k 
搜索 策略 仍然 是 深度 优先 . 下 面 以 实例 说 明 算 法 运行 过 程 .实例 : G=(V,E) 如 图 5.9 
所 示 . 


20 4 


图 5.9 一 个 最 大 团 的 实例 


按照 1,2,3,4,5 的 次 序 考虑 扩张 团 中 结 点 . 则 搜索 树 如 图 5. 9 中 右 图 所 示 . 在 下 列 结 
点 处 ， 

a: 得 到 第 一 个 极 大 团 {1,2.4}) ,顶点 数 为 3, 因而 界 也 为 3; 代 价 函 数 也 为 3. 

0: 代价 函数 值 FF 二 3, 回 济 ; 

c: 得 到 第 二 个 极 大 团 {1,3,4,5) ,顶点 数 为 4, 修 改 界 为 4; 

d: 不 必 搜 索 其 他 分 支 .因为 代价 函数 值 下 都 为 4, 不 超过 界 ; 

ec: 下 一 4 .不必 搜索 . 
最 大 团 为 {1,3,4,5) ,顶点 数 为 4. 
该 子 集 树 的 结 点 个 数 为 0(2"), 算 法 在 每 个 结 点 处 考查 新 加 入 的 结 点 和 以 前 结 点 是 否 
构成 团 ,并 计算 代价 函数 ( 叶 结 点 除外 ), 叶 结 点 处 还 要 计算 团 中 元 素 个 数 是 否 最 多 ,因而 ,在 
最 坏 情况 下 ,算法 要 进行 0(n) 次 计算 . 从 而 该 算法 在 最 坏 情况 下 的 时 间 复 杂 性 为 O(n2”). 


5.4.3 货 朗 问题 
例 5.10 货 郎 问题 .给 定 n 个 城市 集合 C= 二 {1,2,…,n}), 从 一 个 城市 到 另 一 个 城市 的 
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距离 为 正 整 数 , 求 一 条 最 短 且 每 个 城市 恰好 经 过 一 次 的 巡回 路 线 . 

解 不 妨 设 巡 回路 线 从 1 开始 , 解 向 量 为 二 i 二 1, 谋 io,is1 记 ,其 中 及 ,issn*,in1l 
为 {2,3,…,n} 的 一 个 排列 . 搜索 空间 为 排列 树 ,如 例 5. 3 所 示 . 下 面 在 例 5. 3 给 出 的 回溯 算 
法 基础 上 ,定义 代价 函数 和 界 函 数 ,以 便 加 快 回溯 . 

约束 条 件 : 在 排列 树 中 , 结 点 过 ia 一 1 2,…, 关 过 表示 已 得 到 & 步 巡回 路 线 . 令 了 B 一 
{ioyayia,…, 关 } 是 已 经 经 过 的 城市 集合 , 则 zaE {2,…,n} 一 B. 

界 : 当前 得 到 的 最 短 巡 回路 线 长 度 . 

代价 函数 工 : 设 c 为 已 得 到 的 巡回 路 线 中 第 j 段 的 长 度 ,1 志 jj 二 ;ls 为 由 顶点 4 出 发 的 
最 短 边 长 度 , 则 


L= > ag+h + 2 
ji EB 


为 目前 部 分 巡回 路 线 扩张 成 全 程 巡回 路 线 的 长 度 下 界 . 其 中 De 为 已 选 定 巡 回路 线 的 长 


度 ,4 十 >)/， 为 经 过 剩余 结 点 回 到 结 点 1 的 最 短 距离 的 一 个 下 界 . 
iEB 


搜索 策略 仍然 是 深度 优先 方法 . 下 面 以 例 5. 3 中 的 实 
例 来 说 明 分 支 限 界 策略 的 执行 过 程 . 其 排列 树 中 结 点 对 应 
的 代价 函数 和 界 函 数 如 图 5. 10 所 示 , 其 中 代价 函数 值 为 
下 , 界 函数 值 为 B, 界 函数 的 初始 值 为 2. 

在 结 点 二 1,2,3,4 二 处 , 界 函 数 得 到 第 一 次 更 新 ,更 新 
为 py B=29 B=23 B=23 

在 结 点 二 1,2,4,3 二 处 , 界 函 数 得 到 第 二 次 更 新 ,更 新 图 5.10 货 郎 问题 的 一 个 实例 
为 23. 二 1,2,4,3 二 也 是 该 实例 的 最 优 解 ,最 优 值 为 23. 

在 结 点 过 1,3,2 二 处 ,代价 函数 值 为 26 ,大 于 界 函 数值 , 故 不 在 分 支 ,回溯 到 父 结 点 . 

在 结 点 二 1,3,4,2 二 处 ,得 到 另 一 个 最 优 解 . 

在 结 点 二 1,4,2 二 处 ,代价 函数 值 为 15, 算 法 继续 向 前 搜索 ,到 达 二 1,4,2,3 ,长度 为 
28 ,这 个 解 不 是 最 优 解 , 舍 去 . 

在 结 点 二 1,4.3 二 处 ,代价 函数 值 为 20. 继 续 搜 索 ,但 没有 更 好 解 ,算法 回溯 到 树 根 终 
止 . 返回 两 个 最 优 解 : 1,2.4.3 二 和 一 1,3,4,2 二 ,返回 最 优 值 23. 即 售 货 员 沿 着 如 下 两 条 
路 线 ,1 一 2 一 4 一 3 一 1 和 1-~3 一 4 一 2 一 1 都 可 达到 最 短 巡 游 路 径 , 最 短 巡 游 路 径 的 长 度 
为 23. 

算法 在 最 坏 情况 下 的 时 间 复 杂 度 仍然 为 O((n 一 1)1) ,这 是 因为 : 该 树 的 结 点 个 数 仍然 
是 O((Cz 一 1)1; 在 每 个 结 点 处 除了 要 计算 已 得 到 的 路 径 的 长 度 外 ,还 要 计算 代价 函数 的 值 
( 叶 结 点 除外 ) ,在 叶 结 点 处 还 要 计算 得 到 的 回路 的 长 度 .并 判断 得 到 的 回路 是 否 为 当前 的 最 
短 回 路 ;计算 已 得 到 的 路 径 的 长 度 最 多 需要 O(1) 次 计算 ;通过 预 处 理 方法 可 以 给 出 从 每 个 
结 点 出 发 到 达 其 他 城市 间距 离 的 最 小 值 ,从 而 在 计算 代价 函数 时 可 以 在 父 结 点 的 代价 函数 
值 中 加 上 父 结 点 到 本 结 点 的 距离 ,并 减 去 从 父 结 点 出 发 的 最 小 距离 ,所 以 算法 在 每 个 结 点 处 
最 多 进行 3 次 加 法 和 一 次 大 小 比较 , 即 算法 在 每 个 结 点 处 至 多 进行 0(1) 次 运算 , 故 算法 在 
最 坏 情况 下 的 时 间 复 杂 度 为 O((n 一 1)1). 
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S.4.4 圆 排列 问题 


例 5.11 圆 排 列 问题 . 给 定 交 个 圆 的 半径 序列 ,将 它们 放 到 拢 形 框 中 ,各 圆 与 矩形 底 边 
相 切 ,图 5. 11 给 出 了 三 个 圆 的 具有 两 种 不 同 长 度 的 排列 方式 . 我 
们 的 问题 是 : 求 具有 最 小 排列 长 度 /, 的 圆 排 列 . 

解 设 各 圆 标 号 分 别 为 1,2,…,n， 则 可 行 解 为 向 量 
一 一, 其 中 心 惰 ,… 光 为 1,2,…,7 的 排列 ,表示 第 
1 到 第 个 位 置 所 放置 的 圆 分 别 是 标号 为 ,is,…,is 的 圆 . 解 空 
间 为 排列 树 . 

设 标 号 为 ,is。，…,is 的 圆 的 半径 分 别 为 天 ,mm 下 面 
定义 代价 函数 和 界 函 数 . 

上 述 排列 树 中 , 结 点 可 表示 为 向 量 近 六, 空 ,…, 关 二 ,其 中 心 ， 图 5.11 两 个 排列 具有 
站 是 (1,2,…,2} 中 上 个 元 素 的 一 个 排列 ,表示 前 A 个 位 置 不 同 长 度 
的 圆 已 经 排 好 ,分 别 是 标号 为 三 ,ii 的 圆 . 令 B= (i,is，…， 

站 ) , 若 下 一 个 位 置 选择 标号 为 wxr 的 圆 , 则 ii € {1,2,…,n} 一 B. 

界 函 数 在 一 二 泣 ,… 汉 过 处 的 值 是 当前 已 得 到 的 最 小 圆 排列 长 度 , 初 值 为 无 穷 大 . 为 定 
义 代价 函数 , 先 定义 如 下 记号 : 

Zh: 第 个 位 置 所 放 的 圆 的 圆心 横 坐 标 ,1 二 k 志 nn. 规定 第 一 个 圆 的 圆心 为 坐标 原点 , 即 
zi1=0, 

di: 第 个 位 置 所 放 的 圆 的 圆心 模 坐 标 与 第 k 一 1 个 位 置 所 放 的 圆 的 圆心 横 坐 标的 差 ， 
1<k<n; 

4: 前 & 个 位 置 所 放 的 圆 的 排列 长 度 ,1k<n; 

Li: 代价 函数 在 过 ,is，…,i 记 处 的 值 . 即 放 好 第 1 到 第 & 个 位 置 的 圆 以 后 ,对 应 结 点 
的 代价 函数 值 ,L, 志 4, ,1 二 kn. 

参见 图 5. 12 ,不 难 找 到 这 些 参数 之 间 的 关系 ,它们 满足 如 下 公式 ， 

2 一 TI 十 cu 


ds = VC Tr) — (rm 一 天 并 一 2 rr 


J 二 和 十 有 十 7 


图 5.12 圆 排列 问题 中 各 参数 之 间 的 关系 
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按照 定义 ,Ls 是 放 好 第 1 到 第 & 个 位 置 的 圆 以 后 , 剩 下 的 圆 无 论 以 什么 顺序 排列 ,所 能 得 到 
的 所 有 7 个 圆 的 排列 长 度 的 下 界 . 若 剩 下 的 2 一 &A 个 圆 的 排列 顺序 是 aas: 则 所 
得 到 的 排列 长 度 为 

2 十 和 的 


一 ,二 十 和 Pro 十 2 Re 十 十 2 十 页 十 后 

之 zi 十 20n—k)ri+ri+rni = zt (2n—2k 十 1)r+i+ri 
其 中 ,r 二 min {ri ,rin ，…… ,7 ), 即 为 后 面 待 选 的 n 一 k 个 圆 以 及 第 k 个 圆 中 最 小 半径 的 值 . 
所 以 下 界 L 可 定义 为 x 十 (2n 一 2k 十 Dr 十 m. 上述 代 价 函 数 的 设 定 可 参见 图 5. 13. 


图 5.13 圆 的 排列 长 度 


搜索 策略 仍然 为 深度 优先 . 下 面 的 实例 说 明了 该 算法 的 执行 过 程 . 设 一 6,6 个 圆 的 半 
径 分 别 为 1,1,2,2,3,5, 标 号 分 别 为 1,2,… ,6. 其 排列 树 中 ,同一 层 边 的 标号 从 小 到 大 排列 ， 
则 最 左 侧 分 支 的 各 结 点 分 别 为 根 结 点 .二 1 二 二 1,2 二 ……、 二 1,2,…,6 二 ,其 对 应 的 各 参数 
值 如 表 5. 1 所 示 ,计算 过 程 参见 图 5. 14. 


表 5.1 代价 函数 的 计算 过 程 


k re ds Ik ls L: 
1 1 0 0 2 12 
2 1 2 2 4 12 
3 2 2.8 4.8 18 19.8 
4 2 4 8.8 11.8& 19.8 
5 3 人 让 13.7 1 23.7 
6 5 Vi 21.4 27.4 27.4 


图 5.14 圆 排 列 问题 的 一 个 实例 
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在 结 点 二 1 二 处 的 代价 函数 值 为 zi 十 (2X6 一 2X1 十 1)X1 十 1 二 12, 界 函数 值 为 oo. 在 
结 点 二 1,2,… ,6 二 处 的 代价 函数 值 为 ze 十 (2X6 一 2X6 十 1)X5 十 1 二 21.4 十 5 十 1 二 27. 4. 
去 1,2,…:,'6 二 也 是 算法 得 到 的 第 一 个 可 行 解 , 得 到 圆 排列 长 度 /二 27.4, 于 是 将 界 函 数值 更 
新 为 27. 4. 

继续 搜索 该 排列 树 ,在 结 点 二 1.3,5,6,4,2 二 处 得 到 最 优 解 26. 5. 

该 搜索 树 含有 十 n(n 一 了 十 … 十 (n(n 一 1)…2) 十 n!1 二 O(n1) 个 结 点 ,而 在 每 个 结 点 处 
要 计算 所 得 圆 的 排列 长 度 , 并 计算 代价 函数 的 值 ( 叶 结 点 除外 ). 在 计算 代价 函数 时 ,要 计算 
剩余 圆 的 半径 最 小 值 , 故 需要 O(n) 次 计算 ,从 而 算法 在 最 坏 情况 下 的 时 间 复 杂 度 为 
O(nn!l)=0O((n+1)1) 


5.4.5 连续 邮资 问题 


例 5.12 连续 邮资 问题 设 有 种 不 同 面值 的 邮票 ,每 个 信封 至 多 贴 m 张 邮 票 , 试 给 出 
邮票 面值 的 最 佳 设计 (面值 为 正 整 数值 ) ,使 得 到 从 1 开始 , 增 量 为 1 的 连续 邮资 区 间 最 大 
(本 例 中 ,所 谓 的 区 间 [a,0], 指 的 是 a 与 b 间 所 有 整数 值 , 记 为 (a,… ,6)). 

例如 当 n=5,m 二 4 时 ,如 面值 X= 二 1,3,11,15,32 之 可 得 邮资 连续 区 间 为 {1,…,70); 
如 果 面 值 为 X= 二 1,6,10,20,30 二 , 则 邮资 连续 区 间 为 {1,…,4), 因 为 5 没有 办 法 构成 . 所 
以 不 同 的 面值 序列 得 到 不 同 的 连续 邮资 区 间 . 

解 ” 可 行 解 应 该 为 一 个 妈 元 序列 二 zz ,zw 二 ,其 中 心 王 1. 这 样 的 序列 可 以 排 成 
一 棵 树 ,但 既 不 是 排列 树 也 不 是 子 集 树 ,因为 每 个 分 量 的 值 的 范围 并 没有 直接 给 出 ,所 以 在 
初始 构造 搜索 空间 时 并 不 知道 每 个 结 点 的 分 支 个 数 . 

算法 不 仅 要 确定 搜索 的 策略 ,还 要 边 搜索 边 生 成 搜索 树 , 也 就 是 在 每 个 结 点 处 ,不 仅 要 
确定 是 否 分 支 和 如 何 分 支 .还 要 确定 分 支 的 个 数 . 

为 获得 更 大 的 连续 邮资 区 间 , 可 行 解 二 xi ,x2，,… ,zx 二 的 分 量 满 足 zi 一 zs 二 …<zh 设 
在 结 点 二 zi ,xs，…zi; 二 处 ,邮资 最 大 连续 区 间 为 {1,… ,ri) , 则 ziri 的 取 值 范围 为 {xi 十 1,…， 
i 十 1), 因为 zi 过 zi 所 以 zi 的 最 小 值 为 zx; 十 1. 如 果 zh 之 ri 十 1, 则 zi 十 1 的 邮资 没有 
办 法 使 用 xit 面值 的 邮票 ,只 能 使 用 x ,xs，…,xz; 面值 的 邮票 ,这 与 结 点 二 zi yzz ,Xi 二 
的 邮资 最 大 连续 区 间 为 {1,….x;) 矛 盾 . 从 而 给 出 了 该 结 点 的 分 支 个 数 . 

搜索 策略 : 深度 优先 . 

约束 条 件 : 在 二 zi z ,zi 二 处 ,邮资 最 大 连续 区 间 为 11, 天 六 则 zn € {zi 十 1,…， 
[避风 

maz: 用 当前 最 优 解 对 应 的 m 张 邮票 可 付 的 最 大 邮资 . 初始 maz 王 0, 如 果 可 行 解 的 
六 二 az * 则 用 m 取代 max 作为 新 的 maz 值 . 

选 了 ri 后 得 到 的 当前 最 大 连续 邮资 区 间 的 长 度 可 递归 计算 如 下 : 

yi(j): 用 不 超过 m 张 面值 为 x1 .x2….z; 的 邮票 贴 j 邮资 时 的 最 少 邮票 数 , 则 

yi(j) = Dt ym 一 其 | 兴 
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ri= min(j | GO 委 my 十 1) 二 和 2) 
实例 : "一 4, 交 一 3. 搜 索 树 如 图 5. 15 所 示 . 
在 二 1 二 处 .用 不 超过 三 张 面 值 为 1 的 邮票 能 贴 出 的 最 大 邮资 区 间 是 {1,…,n} 二 {1,2， 
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rl2 13 15 17 14 15 16 18 21 24 
图 5.15 连续 邮资 问题 的 一 个 实例 


3). 因而 zs 的 选择 是 (2,3,4}. 在 <<1,2 二 处 ,m: 一 6, 故 zs 的 选择 是 {3,…,7}) ,搜索 所 有 结 点 
后 发 现 ,X 王 二 1,4,7,8 盖 时 ,达到 最 大 连续 邮资 区 间 {1,2,…,24}). 


习 题 5 


要 求 : 对 于 回溯 法 ,要 说 明 解 向 量 、 搜 索 树 结 构 、 搜 索 策 略 、 代 价 函 数 ( 如 果 存 在 ) 等 ,并 
给 出 最 坏 情况 下 的 时 间 复 杂 度 函数 . 对 于 给 定 的 数 的 输入 实例 , 求 出 所 有 的 可 行 解 (或 一 个 
最 优 解 ). 
5.1 用 回溯 法 求 下 列 不 等 式 的 所 有 的 整数 解 . 要 求 给 出 伪 码 和 解 . 
3zl 十 4zs 十 2zas 委 12 
Zivzavza 为 非 负 整数 
5.2 最 小 重量 机 器 设计 问题 : 某 设 备 需要 4 种 配件 ,每 种 1 件 .有 3 个 供应 商 提供 这 些 配 
件 , 表 5.2 给 出 相关 的 价格 和 每 种 配件 的 重量 ;从 中 选择 这 4 种 配件 ,使 得 总 价值 不 超 
过 120, 且 总 重量 最 轻 . 


表 5.2 产品 和 供应 商 信息 表 


供应 商 1 供应 商 2 供应 商 3 
零件 编号 
价格 重量 价格 重量 价格 重量 
1 10 5 8 6 12 4 
2 20 8 21 10 30 5 
3 40 5 42 4 30 10 
4 30 20 60 10 45 15 


5.3 如 图 5.16 所 示 , 一 个 4 阶 Latin 方 是 一 个 4X4 的 方 格 ,在 它 的 每 个 方 格 内 填 和 人 1,2,3 
或 4, 并 使 得 每 个 数字 在 每 行 . 每 列 都 恰好 出 现 一 次 . 用 回溯 法 求 


出 所 有 第 一 行为 1,2,3,4 的 4 阶 Latin 方 . 将 每 个 解 的 第 2 行 至 1 | | 
第 4 行 的 数字 从 左 到 右 写 成 一 个 序列 . 例如 图 5. 16 中 的 Latin 方 ”| | 4 | 
对 应 于 解 : 二 3,4,1,2,4,3,2,1,2,1,4,3 之 .给 出 所 有 可 能 的 4 阶 上 3? 1 


Latin 方 . 
atin 图 5.16 Latin 方 
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5.4 应 用 回 漳 算 法 给 出 {1.2.3,4} 的 所 有 置换 . 
5.5 给 出 8 皇后 问题 的 一 个 广度 优先 回溯 算法 ,并 分 析 该 算法 的 时 间 复 杂 度 . 本 
5.6 子 集 和 问题 . 设 ”个 不 同 的 正 数 构成 集合 S , 求 出 使 得 和 为 某 数 M 的 S 的 所 有 子 集 . 是 
5.7 分 派 问题 .给 个 人 分 配件 工作 ,给 第 i 个 人 分 配 第 ; 件 工 作 的 成 本 是 C(Gi7. 试 求 

成 本 最 小 的 工作 分 配方 案 . 
5.8 电路 板 排列 问题 : 设 B={1,2,…,n} 是 n 块 元 

电路 板 的 集合 ,上 一 {Ni ,Na ,…,No} 是 六 块 二 SS 

连接 块 的 集合 .对 j 一 1,2,…,m, 连 接 块 VS AAS 2 

B 相当 于 一 条 导线 ,把 属于 Ni 的 所 有 电路 板 3 4 6 5 1 7 8 2 

连 起 来 .如 图 5.17 所 示 ,B=={1,2,…,8}), 其 1 2 3 4 5 6 7 8 

中 位 置 1,2,…,8 是 插 槽 ,每 个 插 槽 可 以 插入 图 5.17 电路 板 问题 的 实例 

一 块 电路 板 . 当 电 路 板 按照 某 种 排列 顺序 全 部 

插入 后 ,一些 连 接 块 的 导线 有 可 能 从 一 块 电路 板 插 槽 跨 到 相 邻 的 另 一 个 插 槽 . 比如 

图 5.17 中 的 5 块 连接 块 是 : 

Ni = {4,5,6}, Ns = (2,3}， Ni = {1,3}, Ni = {3,6}, Ni = {7,8} 

如 果 电 路 板 按照 3,4.6,5,1,7,8,2 的 顺序 排列 ,那么 横 跨 插 槽 1 和 2 的 连 线 数 是 3， 

即 连接 块 N,、N3 和 Ni : 横 跨 插 槽 2 和 3 的 连 线 数 是 4, 即 连接 块 Ni 、 Ne 、Ns 和 Ni; 

…:; 横 跨 插 槽 7 和 8 的 连 线 数 是 1, 即 连接 块 N: ;其 中 横 跨 两 个 相 邻 插 槽 的 最 大 连 线 

数 是 4. 称 4 是 排列 X= 二 3.4.6,5,1,7,8,2 二 的 排列 密度 , 记 作 density(X). 对 于 电 

路 板 的 不 同 排列 X 和 X“ ,其 排列 密度 值 可 能 是 不 一 样 的 . 我 们 的 问题 是 : 给 定 集合 B 

和 工 , 求 排列 密度 最 小 的 电路 板 排 列 . 

(1) 对 上 述 电 路 板 问 题 的 实例 , 求 出 该 实例 的 最 优 解 . 

(2) 不 遍历 搜索 树 ,用 数学 方法 证 明 你 的 解 是 最 优 的 . 
5.9 设 有 项 任务 由 个 可 并 行 操作 的 机 器 完成 .完成 任务 i 所 需要 的 时 间 是 1;, 求 一 个 


最 佳 任务 分 配方 案 , 使 得 完成 时 间 ( 从 时 刻 0 计时 ,到 最 后 一 人 台 机 器 停止 的 时 间 ) 达 到 
最 短 . 

5.10 在 5.9 题 中 ,假设 每 个 任务 有 个 完成 期 限 Bi ,以 及 超出 期 限 的 罚款 数 广 . 试 求 一 个 最 

佳 任务 分 配方 案 使 得 完成 所 有 任务 的 总 罚款 最 少 . 

5.11 卫兵 布置 问题 .一 个 博物 馆 由 排 成 mxXn 个 矩形 阵列 的 陈列 室 组 成 ,需要 在 陈列 室 中 
设立 哨 位 ,每 个 哨 位 上 的 哨兵 除了 可 以 监视 自己 所 在 陈列 室外 ,还 可 以 监视 他 上 、 下 、 
左 、 右 四 个 陈列 室 , 试 给 出 一 个 最 佳 哨 位 安排 方法 ,使 得 所 有 陈列 室 都 在 监视 之 下 ,但 
使 用 的 哨兵 最 少 . 
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前 面 5 章 介 绍 了 常用 的 算法 设计 的 通用 技术 , 本 章 和 下 一 章 将 要 介绍 几 个 重要 问题 的 
算法 . 一 方面 , 这 几 个 问题 都 是 应 用 非常 广泛 的 数学 模型 , 在 应 用 这 些 模型 解决 实际 问题 
时 当然 离 不 开 它们 的 算法 . 另 一 方面 , 通过 学 习 这 几 个 问题 的 算法 可 以 加 深 对 算法 设计 的 
理解 . 一 个 好 的 算法 通常 不 是 简单 地 应 用 算法 设计 的 通用 技术 就 能 得 到 的 , 必须 对 问题 本 
身 进 行 深入 的 研究 . 在 这 两 章 中 将 会 看 到 这 样 的 研究 和 分 析 在 算法 设计 中 的 作用 . 

1939 年 苏联 数学 家 、 经 济 学 家 、1975 年 诺 贝 尔 经 济 学 奖 获 得 者 L. V. Kantorovich 在 
《组 织 和 计划 生产 的 数学 方法 》 一 文中 最 早 提出 了 线性 规划 , 1947 年 G. B. Dantzig 给 出 一 
般 的 线性 规划 模型 和 单纯 形 法 . 线性 规划 模型 有 着 极其 广泛 的 应 用 , 特别 是 在 经 济 领域 . 
大 型 电子 计算 机 的 出 现 不 但 极 大 地 推动 了 线性 规划 的 应 用 , 而 且 也 推动 了 线性 规划 理论 的 
发 展 . 1979 年 苏联 数学 家 L. G. Khachian 给 出 线性 规划 的 椭 球 算法 . 这 是 一 个 多 项 式 时 间 
算法 ,从 而 证 明 线性 规划 是 多 项 式 时 间 可 解 的 . 但 椭 球 算法 实际 运行 很 慢 ，1984 年 印度 数 
学 家 N，Karmarkar 给 出 一 个 新 的 多 项 式 时 间 算 法 一 投影 算法 .在 理论 上 和 实际 运行 效果 
都 优 于 椭 球 算法 . 

尽管 单纯 形 法 在 最 坏 情 况 下 是 指数 时 间 的 , 但 通常 它 的 计算 速度 是 很 快 的 , 在 实际 应 
用 中 是 有 效 的 . 不 但 如 此 , 它 还 能 提供 大 量具 有 各 种 经 济 含义 的 数据 , 因此 单纯 形 法 仍然 
是 最 常用 的 线性 规划 算法 . 


6.1 线性 规划 模型 


6.1.1 模型 


先 看 几 个 例子 . 

例 6.1 生产 计划 问题 . 

甲 公司 用 3 种 原料 混合 制 成 2 种 清洁 剂 . 每 千克 清洁 剂 A 由 0. 25 千克 原料 1、0.5 千 
克 原 料 2 和 0. 25 千克 原料 3 混合 而 成 , 每 千克 清洁 剂 B 由 0. 5 千克 原料 1 和 0. 5 千克 原 
料 2 混合 而 成 . 每 吨 清洁 剂 A 和 也 的 售 价 分 别 是 12 万 元 和 15 万 元 . 公司 现 有 120 吨 原料 
1、150 吨 原料 2 和 50 吨 原料 3. 这 两 种 清洁 剂 应 各 配制 多 少 才能 使 得 总 价值 最 大 ? 

设 清 洁 剂 A 和 也 分 别 配制 zx 和 y 吨 , 总 共 需 要 消耗 0. 25z 十 0. 5y 吨 原料 1，0. 5z 十 0. 5y 
吨 原料 2 和 0. 25xz 吨 原料 3, 总 价值 为 z= 二 12x 十 15y 万 元 . 根据 要 求 ,应 在 满足 0. 25z 十 0. 5y 三 
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120,0. 5z 十 0. 5y 委 150 和 0. 25z< 委 50 的 条 件 下 使 得 > 一 12z 十 15y 最 大 . 当然 ,这 里 z+ 和 y 都 是 
非 负 数 . 于 是 ,问题 可 表述 为 


地 口 四 


max > 一 12r 十 15y 
St 0.25z+0.50y 过 120 
全 0 天 十 0 0 过 0 
0: 25r 二 50 
T=0 v0 
这 里 s.t. 表示 “服从 ”或 “满足 ”* 下 述 条 件 . 其 中 > 是 目标 函数 ,s. +t. 后面 的 不 等 式 是 约束 条 
件 . 该 问题 要 求 在 满足 约束 条 件 的 前 提 下 ,使 目标 函数 值 最 大 . 
例 6.2 投资 组 合 问题 . 
某 基金 正在 安排 一 项 10 亿 元 的 投资 . 采用 组 合 投资 的 方式 ,确定 了 5 个 投资 项 目 , 其 
中 项 目 1 和 项 目 2 是 高 新 技术 产业 的 企业 债 ,项 目 3 和 项 目 4 是 基础 工业 的 企业 债 ,项 目 5 
是 国债 和 地 方 政府 债 .预测 它们 的 年 收益 率 (%) 分 别 为 8.1,10.5,6.4,7.5 和 5.0. 基于 风 
险 的 考虑 ,要 求 投资 组 合 满足 下 述 条 件 : 
(1) 每 个 项 目 不 超 过 3 亿 元 . 
(2) 高 新 技术 产业 的 投资 不 超过 总 投资 的 一 半 , 即 5 亿 元 ,其 中 项 目 2 又 不 超过 高 新 技 
术 产 业 投资 的 一 半 ， 
(3) 国债 和 地 方 政 府 债 不 少 于 基础 工业 项 目 投资 的 40%. 
试 确定 投资 组 合 中 各 项 目的 投资 额 ,使 年 收益 率 最 大 . 
设 项 目 i 的 投资 额 为 x; 亿 元 ,i 二 1,2,3,4,5. 问题 可 表述 成 
maxz 8 1 十 0 Sa5 + 6. 2 二 + T5505 
Bt Wi 和 
zs3 
Xs 二 3 
i 
my 


Zl 十 Zs 过 5 
wi 二 ms 其 衣 一 世 芝 0 
Xs 过 0.4(zs 十 zi)， 即 0.4zs 十 0.4z 一 2 魏 0 
wa 让 Fw wm = 
Xi 宇 0，i=1,2,3,4,5 
例 6.3 运输 问题 。 
某 公司 有 2 个 工厂 ,3 个 分 销 中 心 . 工厂 的 年 产量 、 分 销 中 心 的 年 需求 量 ( 吨 ) 以 及 工厂 
到 分 销 中 心 的 单位 运费 (元 / 吨 ) 如 表 6. 1 所 示 . 
这 里 总 产量 等 于 总 需求 量 , 即 产销 平衡 . 试制 定 各 工厂 供应 各 分 销 中 心 的 数量 ,使 总 运 
费 最 小 . 
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工厂 的 年 产量 / 吨 、 分 销 中 心 的 年 需求 量 / 吨 以 及 工厂 到 分 销 中心 的 单位 运费 /( 元 / 吨 ) 


表 6.1 
本 分 销 中 心 1 分 销 中 心 2 分 销 中 心 3 年 产量 
正好 全 3 2 学 5000 
工厂 区 人 5 。 6000 
年 需求 量 6000 4000 1000 11 000 


设 工厂 i 供应 分 销 中 心 j 的 数量 为 zi ,i 二 1,2, 且 j= 二 1.2,3. 问题 可 表述 为 


min xz 一 3zl 十 2zis 十 7zis 十 7zzl 十 5zzs 十 2zzs 


s.t， 2 十 Ziz 十 zls 一 5000 
Xal 十 X22 十 X23 一 6000 
Xu 十 Xz 一 6000 
X12 十 Zaz 一 4000 
ls 十 Xz 一 1000 
XTi 宇 0， i== 1,2， 


j=1, 


2,3 


注意 ,这 里 前 2 个 约束 等 式 之 和 与 后 3 个 约束 等 式 之 和 的 左边 相同 ,都 是 所 有 (6 个 ) zj; 的 
和 ,它们 的 右边 当然 也 应 该 相等 ,5000 十 6000 二 6000 十 4000 十 1000 ,这 就 是 产销 平衡 . 
例 6.4 饲料 配方 问题 。 
饲养 场 饲 养 动物 需要 考虑 m 种 营养 素 ,假设 每 头 动物 每 天 至 少 需 要 bi; 个 单位 的 营养 素 
i, 市 场 上 及 n 种 饲料 可 供 选 择 , 饲 料 j 每 千克 含有 as 个 单位 的 营养 素 i , 售 价 cj 元 . 要 在 保 
证 动物 有 足够 营养 的 前 提 下 使 饲料 成 本 最 低 ,饲料 应 如 何 配方 ? 


设 每 头 每 天 的 饲料 中 含 zj 千克 饲料 j ,1 入 入 2” 问题 可 表述 为 


min x 一 Doz; 


j=1 


总 
J™i 


i>0 1 入 /入 元 


线性 规划 的 一 般 形式 为 


min(max) z= Sy 


zi 宇 0, jE dl1,2,.",n} 
名 任意 ， 7 了 EE (1125 动 一 了 


2 oz; 是 目标 函数 , 下 面 的 不 等 式 和 等 式 是 约束 条 件 ,这 里 
i=1 

都 是 变量 zj; 的 线性 函数 . min x 和 max z 分 别 表示 要 求 目标 函数 最 小 

小 化 和 最 大 化 可 以 相互 转换 ,min < 等 同 于 max( 一 <) ,而 max xx 等同 


C6 1 


目标 函数 和 约束 条 件 
和 目标 函数 最 大 ,最 


F min( 一 =). 每 个 约 


线性 规划 


东 条 件 可 以 是 不 等 式 (三 或 三 ) ,也 可 以 是 等 式 . x; 宇 0,j e] 也 是 一 种 约束 条 件 , 但 通常 只 把 
前 m 个 不 等 式 ( 或 等 式 ) 称 作 约 束 条 件 , 而 把 z; 宇 0 称 作 非 负 条 件 . zx; 任意 表示 对 zx 没有 非 
负 约束 ,可 以 取 任 意 实 数 , 称 作 自 由 变量 . 

满足 约束 条 件 和 非 负 条 件 的 变量 zi ,zz ,…'zn 称 作 可 行 解 ,所 有 可 行 解 组 成 的 集合 称 
作 可 行 域 . 对 于 最 小 化 (最 大 化 ) 问 题 .目标 函数 值 取 到 最 小 值 (最 大 值 ) 的 可 行 解 称 作 最 优 
解 ,对 应 的 目标 函数 值 称 作 最 优 值 . 

下 面 通过 对 最 简单 的 情况 一 -只 有 两 个 变量 的 线性 规划 一 -的 讨论 ,直观 地 了 解 线性 规 
划 的 基本 性 质 . 


6.1.2 二 维 线性 规划 的 图 解法 


考虑 例 6. 1, 它 的 可 行 域 是 由 直线 0. 25z 十 0. 50y 王 120,0. 50z 十 0. 50y 一 150,0. 25x 一 
50 及 2 条 坐标 轴 围 成 的 平面 区 域 G, 如 图 6. 1 所 示 . G 是 一 个 凸 多 边 形 ,有 5 个 顶点 : 
O(0,0),A(O,240),B(120,180),C(200,100),D(200,0). 

当 < 为 常数 时 ,12z 十 15y 二 > 是 一 条 直线 . 如 果 这 条 直线 与 G 相交 ,那么 直线 上 在 G 内 
的 点 (zx,y) 是 目标 函数 值 等 于 < 的 可 行 解 . 图 6. 1 中 下 方 的 两 条 虚线 是 目标 函数 值 为 1200 
和 2400 的 直线 . 取 不 同 的 < 值 ,得 到 一 组 平行 的 直线 . 越 往 上 < 值 越 大 ， 当 直线 到 达 B 点 
后 ,如 果 再 往 上 就 和 G 不 相交 了 ,从 而 直线 上 的 点 都 不 是 可 行 解 . 可 见 ,B 是 可 行 域 G 中 使 
目标 函数 值 取 到 最 大 值 的 点 . 也 就 是 说 ,B 点 的 坐标 z=120,y 王 180 是 最 优 解 ,最 优 值 为 
12X120 十 15X180 一 4140， 


0.25x=50 


、\ 


~、 
100 人 玉 、 = 0.25x+0.5y=120 


例 6.5 把 例 6.1 中 的 目标 函数 改 为 ==12z 十 12y, 约 束 条 件 和 非 负 条 件 不 变 . 此 时 ， 
可 行 域 不 变 , 但 表示 目标 函数 直线 的 斜率 改变 了 ,如 图 6. 2 所 示 . 直线 越 往 上 ,对 应 的 目标 
函数 值 越 大 . 注意 到 ,目标 函数 直线 的 斜率 与 0. 5z 十 0. 5y 一 150 的 斜率 相等 ,它们 是 平行 
的 . 当 目 标 函 数 直 线 与 这 条 直线 重合 后 不 再 能 够 继续 向 上 ,因为 再 向 上 移动 与 可 行 域 就 没 
有 交点 了 . 因此 ,目标 函数 值 在 边界 BC 上 的 每 一 个 点 达到 最 大 . BC 上 的 点 的 坐标 是 
二 120t 十 200(1 一 1) = 200 一 80t，y 二 1801 十 100(1 一 ) = 二 100 十 80t，0 过 1 过 1 
所 以 ,有 无 穷 多 个 最 优 解 : x 二 200 一 80t,y 二 100 十 801,0 志 + 过 1, 最 优 值 为 3600. 此 时 最 优 解 
中 包含 两 个 顶点 B 和 C. 


例 6.6 min z=zx 一 2y 


第 
6 
章 
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人 
元 一 个 三 2 
ZX 宇 0， y 宇 0 
解 ” 见 图 6.3, 可 行 域 是 由 直线 2z 十 y 一 2 的 右上 方 、 直 线 x 一 y 二 2 的 左上 方 以 及 工 章 
的 上 方 、y 轴 的 右 方 构成 的 无 界 区 域 . 虚线 是 目标 函数 的 直线 , 越 往 上 目标 函数 值 越 小 . 
于 可 行 域 的 上 方 是 无 界 的 ,对 任意 小 的 = 值 , 直 线 都 有 一 段 在 可 行 域内 . 也 就 是 说 ,可 行 解 
可 以 取 到 任意 小 的 目标 苑 数值 ,因而 不 存在 使 目标 函数 值 最 小 的 可 行 解 ,所 以 无 最 优 解 . 


| 


3 4 x 
图 6.3 


如 果 把 约束 条 件 中 的 第 一 个 不 等 式 2z 十 y 宇 2 改 为 2+ 十 y 三 2, 第 二 个 不 等 式 zx 一 > 魏 2 
改 为 x 一 y 宇 2. 此 时 要 求 可 行 域 在 直线 2z 十 y 一 2 的 左下 方 和 直线 z 一 y 一 2 的 右 下 方 . 没有 
一 个 点 能 够 既 满足 这 两 个 条 件 又 满足 zx 之 0 和 y 三 0, 从 而 可 行 域 是 空 集 , 即 无 可 行 解 . 

通过 上 面 的 例子 ,可 以 看 到 线性 规划 有 下 述 性 质 : 

(1) 关于 解 有 4 种 可 能 : 

Q@ 有 唯一 的 最 优 解 . 

@ 有 无 穷 多 个 最 优 解 . 

@ 有 可 行 解 ,但 无 最 优 解 (目标 函数 值 无 界 ). 

@ 无 可 行 解 ,更 无 最 优 解 . 

(2) 可 行 域 是 一 个 凸 多 边 形 ( 可 能 无 界 , 也 可 能 是 空 集 ). 如 果 有 最 优 解 , 则 一 定 可 以 在 
凸 多边形 的 顶点 取 到 . 

对 于 一 般 的 维 线性 规划 也 是 如 此 , 解 同样 有 上 述 4 种 可 能 . n 个 变量 的 等 式 表示 维 
空间 中 的 一 个 超 平面 ,n 个 变量 的 线性 不 等 式 表示 以 一 个 超 平面 为 界 的 半 个 维 空间 ， 可 
行 域 是 由 若干 超 平面 围 成 的 超 凸 多 面体 ( 当 有 等 式 约束 时 , 维 数 小 于 n). 如 果 有 最 优 解 , 也 
一 定 可 以 在 超 凸 多 面体 的 顶点 取 到 . 


6.2 标 准 形 


6.2.1 标准 形 基 本 概 会 
式 (6. 1) 是 线性 规划 的 一 般 形式 ,下 述 形式 称 作 线 性 规划 的 标准 形 : 
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于 
min xz 一 > Ci 
j=1 


款 娄 Dy =b: i=1,2,,m (6.2) 
j=1 


zj 0, j= 1,2,n 
其 中 6; 宇 0,i 王 1,2,…,m. 在 标准 形 中 , 取 最 小 化 .所 有 的 约束 都 是 等 式 , 且 右 端的 常数 是 非 
负 的 ,所 有 的 变量 是 非 负 的 . 
不 难 把 线性 规划 的 一 般 形式 转化 成 标准 形 ,做 法 如 下 : 


n n 


(1) 把 max x 一 > cizj 替换 成 min x 一 六 一 cz 六 即 取 x = 一 zc'= 一 cj(j = 1， 


=1 j=1 


2 ，… ,7)， 显然 ,二 者 是 等 价 的 . 
(2) 对 所 有 4b; 一 0 的 等 式 和 不 等 式 , 将 两 边 同 时 变 号 ,同时 三 改变 成 三 ,三 改变 成 室 . 这 
样 做 不 会 改变 约束 条 件 . 


(3) 把 每 一 个 不 等 式 > auz, 过 如 蔡 换 成 ayzj 十 y, == 妈 , 并 添加 非 负 约束 jy 宇 0, 其 
中 y 是 一 个 新 变量 , 称 作 松弛 变量 ,这 相当 于 引入 变量 y 一 6 一 az 之 0. 
(4) 把 每 一 个 不 等 式 > auz, 之 与 替 换 成 avzi 一 一 所 ,并 添加 非 负 约束 之 0, 其 
j=1 j=1 


中 yw 是 一 个 新 变量 , 称 作 剩余 变量 . 这 相当 于 引入 变量 y; 一 De —bi > 0. 
(5) 把 每 一 个 自由 变量 忆 替 换 成 /一 攻 , 且 添加 两 个 非 负 条 件 ZI 宇 0, 世 宇 0, 其 中 攻 和 
好 是 两 个 新 变量 . 当 zx) 宇 0 时 ,x) 宇 x ; 当 z 过 0 时 ,xj 二 xz. 反之 亦 然 . 
例 6.7 写 出 下 述 线性 规划 的 标准 形 . 
maxx 一 3zl 一 2zz 十 Zas 
ty 0 
本 一 一 
a 人 任 客 
解 ”首先 把 最 大 化 改写 成 最 小 化 ,min x = 二 一 3zi 十 2zs 一 x3. 然后 对 第 一 个 不 等 式 引 入 
松弛 变量 x ,并 把 它 改 写成 zi 十 3zs 一 3z3 十 x 二 10. 接 下 来 把 第 二 个 不 等 式 的 两 边 变 号 ， 
改写 成 一 4z1 十 zz 十 5x3 宇 30. 引入 剩余 变量 zs ,并 把 这 个 不 等 式 改 写成 一 4zl 十 zz 十 5zs 一 
zs 二 30. 最 后 ,把 所 有 的 zx 替换 成 x 一 x3. 所 有 新 引入 的 变量 xi,zs'zs,zs 都 有 非 负 条 件 . 
得 到 的 标准 形 如 下 


min z’ 一 一 3zl 十 2x2 一 工 十 2 

Ws Xl 十 3zs 一 3X4 十 3z% 十 4 二 10 
一 4zi 十 zz 十 5z3 一 5z4 一 zs 一 30 
I 
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Ws "| | ey " 可 
汪 ， 20 一 ， fc 一 ， 工 一 

ki i 和 Bs i 


标准 形 (6.2) 可 表 成 下 述 和 矩阵 形式 


min z 一 cTz 
s.t.Ar =b (6. 3) 
5 


有 c" 表示 c 的 转 置 ,x 宇 0 表示 向 量 的 每 一 个 分 量 都 大 于 等 于 0. 
又 记 A 的 第 7 列 为 Pj;, 即 


aw 


标准 形 又 可 以 表示 成 下 述 形 式 
min x 一 Si 
La i =b (6.4) 
Zi 宕 0, j=1,2,",n 
6.2.2 标准 形 的 可 行 解 的 性 质 


不 妨 设 和 矩阵 A 的 秩 为 m. 否则 ,或 者 Az= 一 /无 解 ( 当 A 上 添加 4 列 后 得 到 的 矩阵 [A ,Oo 
的 秩 大 于 A 的 秩 时 ) ,或 者 可 以 删 去 多 余 的 等 式 . 

定义 6.1 设 A 的 秩 为 m,A 的 m 个 线性 无 关 的 列 向 量 称 作 标准 形 的 基 , 给 定 基 有 一 
(Pi ,P;, ，,…,P; ) ,对 应 基 中 列 向 量 的 变量 za ,zi。，… ,zi, 称 作 基 变 量 ,其 余 的 变量 称 作 非 
基 变 量 . 

基 变 量 构成 的 向 量 记 作 za 一 (za ,za ,zi 并, 非 基 变量 构成 的 向 量 记 作 zw. 令 zw 一 0， 
等 式 约束 变 成 


Brs=6b 
解 得 zs 一 B 'b. 这 个 向 量 zx 满足 约束 Azx 一 5b 且 非 基 变 量 全 为 0, 称 作 关 于 基 B 的 基本 解 . 
如 果 zz 是 一 个 基本 解 且 z+ 宇 0, 则 称 zx 是 一 个 基本 可 行 解 . 同时 , 称 对 应 的 基 B 为 可 
行 基 . 


例 6.8 考虑 
min =—12%1— 152xs 
s.t. 0.25zi 二 0.50zx; 二 zs = 120 
0.50xi 十 0.50zx: 中 一 150 
0.25z1 十 zs 一 50 
Xi 宇 0，i 二 1,2,*…,5 
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这 是 例 6. 1 中 线性 规划 的 标准 形 .这 里 把 max 改 成 min, 把 变量 x 和 >y 改写 成 zi 和 za, 引入 
3 个 松弛 变量 及 其 非 负 条 件 . 
0.25 050 1 0 0 
小 三 区 0.50 0 1 | 
0.25 0 和 1 
取 基 Bi 王 (P, ,P:,P:). 对 应 地 ,zi ,zz ,zi 是 基 变 量 ,z ,zs 是 非 基 变量 . 令 x=xs = 二 0， 
由 
0. 25zi 十 0. 50zz 十 zs 一 120 
0. 50zi 十 0. 50zs = 150 
0. 25z1 = 50 
解 得 xz 二 200 ,zs 二 100,zs 二 20. 它们 都 满足 非 负 条 件 ,x 一 (200,100,20,0,0)7 是 一 个 基 
本 可 行 解 ,B1 是 可 行 基 . 
再 取 基 Bs 二 (Pi ,P, ,P,). 对 应 地 ,zi ,zz ,z 是 基 变 量 ,zs ,zs 是 非 基 变量 . 令 x 二 xs 二 


0 ,由 
0. 25zi 十 0. 50x» 一 120 
0. 50zi 十 0. 50z? 十 妆 一 150 
0. 25z1 一 50 


解 得 zi = 二 200,zxs 二 140,zxs 二 一 20. xz 不 满足 非 负 条 件 ,z22 一 (200,140,0, 一 20,0)7 是 一 个 
基本 解 , 但 不 是 基本 可 行 解 . B, 不 是 可 行 基 . 

Zz 是 图 6.1 中 的 顶点 C. 一 般 地 ,基本 可 行 解 是 可 行 域 ( 凸 多 面体 ) 的 顶点 . 根据 前 面 
的 观察 ,如 果 线 性 规划 有 最 优 解 ,那么 一 定 存 在 一 个 基本 可 行 解 是 最 优 解 . 下面 证 明 这 个 
事实 . 

引 理 6.1 对 于 标准 形 ,方程 组 Az 一 /的 一 个 解 是 基本 解 的 充分 必要 条 件 是 x 中 的 
非 零 分 量 对 应 的 列 向 量 线性 无 关 . 
证 必要 性 : 根据 基本 解 的 定义 ,这 是 显然 的 . 
充分 性 : 设 a 的 非 零 分 量 为 an ,ws ,oj, 对 应 的 列 向 量 P; ,Pi ,…', 忆 线性 无 关 , 由 
于 A 的 秩 为 m, 必 存在 Pj+1,…,P;, 使 得 PP; ,Pi ,…,Pi 线性 无 关 . 这 m 个 列 构成 一 个 
基 , 记 作 B. a 是 方程 Brs 一 4b 的 解 . 而 这 个 方程 的 解 是 唯一 的 , 故 a 是 关于 B 的 基本 解 . 

定理 6.1 如 果 标 准 形 有 可 行 解 , 则 必 有 基本 可 行 解 . 

证 设 a 是 一 个 可 行 解 ,要 从 a 开始 .逐步 构造 出 一 个 基本 可 行 解 . 做 法 如 下 : 

不 妨 设 的 非 零 分 量 为 el ,as,….a,.r 生 n， 如 果 它 们 对 应 的 列 向 量 Pi ,P,,…,P, 线 性 
无 关 , 由 引 理 6. 1,a 是 一 个 基本 可 行 解 . 否则 ,存在 不 全 为 0 的 ,Xs,…,4, 使 


pa 一 也 
ye 


取 庆 上 入 二 一 一 入 二 0 有 有 


Sp; = 元 
el 


是 ,对 任意 的 6. 有 


击 吕 四 


摹 法 说 计 与 分 新 (入 2 版 ) 


Ko 二 64;)P; Pap, | Dy b 
记 ) 二 Cu ,ns ,Ar ,为 使 4 十 以 成 为 一 个 可 行 解 ,要 求 ” 
wth 二 0 j= 1;2,° sn 
当心 一 0 时 ,不 等 式 自然 成 立 ; 当心 之 0 时 ,要 求 59 当 二 0 时 ,要 求 有 一 入 即 要 
0 


求 当 加 时 ,6 过 5 


设 


oj, 


= min{ | zo) 1 
病 
加 ee . 
取 6 人 令 B=wto" NG=1,2.0), 则 DBP; =0, 且 B00 = 1,2,n), 
: 之 


B=0,B.+1 二 … 二 B, 二 0 .从 而 ,B= 二 (Bi, 民 ，…,B,) 是 一 个 可 行 解 且 比 a 至 少 少 一 个 非 零 
分 量 . 

由 于 一 个 P;( 它 是 非 零 的 ) 是 线性 无 关 的 ,上 述 过 程 至 多 进行 一 1 次 一 定 可 以 得 到 一 
个 基本 可 行 解 . 

定理 6.2 如果 标 准 形 有 最 优 解 , 则 一 定 存在 一 个 基本 可 行 解 是 最 优 解 . 

证 只 需 补充 证 明 : 在 定理 6. 1 的 证 明 中 , 当 是 最 优 解 时 ,8 也 是 最 优 解 , 注意 到 当 
gj 二 0 时 及 二 0, 故 对 足够 小 的 6 二 0,a 十 以 和 a 一 64 都 是 可 行 解 . 从 而 


> cui < Dola 十 以 ) 一 Soy Fan 
j=1 j=1 j=1 j=1 


Do < Dale —m) = Pom ee 
rn Wd j=1 


j=1 


得 Dc 一 0. 于 是 ， 
SNe Sy t+6"4;) Say [| Se Seo 
即 6 一 “十 9 也 是 最 优 解 . 
根据 定理 6. 2, 解 线性 规划 问题 只 需 考 虑 标准 形 的 基本 可 行 解 . A 有 mm 行 n 列 , 至 多 有 
C? 个 基 , 故 至 多 有 C* 个 基本 解 . 这 样 一 来 ,线性 规划 就 成 为 一 个 组 合 优化 问题 . 与 众多 组 
合 优化 问题 一 样 ,用 穷 举 法 求解 是 行 不 通 的 ,需要 寻找 更 有 效 的 算法 . 下 一 节 介绍 最 常用 的 
线性 规划 算法 一 单纯 形 法 . 


6.3 单纯 形 法 


本 节 的 论述 均 针 对 最 小 化 . 
单纯 形 法 的 基本 步 又 如 下 : 
(1) 确定 初始 基本 可 行 解 . 
(2) 检查 当前 的 基本 可 行 解 . 若是 最 优 解 或 无 最 优 解 ,计算 结束 ; 否则 进行 基 变换 ,用 


线性 规划 


一 个 非 基 变 量 蔡 换 一 个 基 变 量 ,得 到 一 个 新 的 可 行 基 和 对 应 的 基本 可 行 解 , 且 使 目标 函数 值 


下 降 (至 少 不 升 ). 
(3) 重复 步骤 (2). 


6.3.1 确定 初始 基本 可 行 解 
暂时 只 考虑 最 简单 的 情况 , 设 约束 条 件 为 


Dasz; <b i=1,2,,m 


Days 十 zeoH 一 并 一 1,2,… 7 
j=1 


取 z+;(i 王 1,2,…,m) 作 为 基 变 量 , 初 始 基 本 可 行 解 为 
"= 007 00 br Bb) 
在 例 6. 8 中 对 例 6. 1 中 的 线性 规划 引入 3 个 松弛 变量 ,得 到 标准 形 


min z 一 一 12zl 一 15z? 

St 02520 0:505s+ ws = 120 
0. 50zl 十 0. 50z2 十 为 一 150 
0. 25z 十 zs 一 50 


万世 0，i 一 1,2,,5 


j=1 
其 中 6b; 宇 0(i==1,2,…,m). 引入 m 个 松弛 变量 xz, +4; 宇 0(i 二 1,2,…,m) ,约束 条 件 转化 为 


取 za ,ziyzs 作 为 基 变量 , 初 始 基 本 可 行 解 为 zx" 一 (0,0,120,150,50)7 ,对 应 的 初始 可 行 基 


BY =(P,, Ps Ps). 


6.3.2 最 优 性 检验 


给 定 可 行 基 B= 二 (Pr ,Prcw，… ,Prcm)) ,考虑 标准 形 中 的 约束 等 式 Ax 二 b 宇 0. 两 边 同 


乘 B71 ,得 
BAz = Bb 
记 A 中 对 应 非 基 变量 的 列 构成 的 矩阵 为 N , 式 (6. 5) 可 写成 
za 十 BTNzN 一 BO 
解 得 
Xs 一 Bb— BNry 
代入 目标 函数 ,得 
2 
= 
=cB(Bb— BNrn) + chrn 
=cBB b+ (ch — cehB Nry 


关于 基 B 的 基本 可 行 解 为 : x 外 一 B 0,z8 一 0, 对 应 的 目标 函数 值 zo。 一 c8B 'b. 这 里 cs 和 


cn 分 别 是 c 中 对 应 基 变 量 和 非 基 变量 的 部 分 . 把 zo 代入 上 式 , 并 做 适当 的 演算 ,得 到 


H+ (ch—chB IN)ry 


+H ted — cBB Bzst+ (ch—cdB :Nzn 


十 器 
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二 zo 十 (ctT—cBB A)zx 
记 
AT = cecT—cBB'A (6. 8) 
代入 上 式 , 得 到 
之 一 zo 十 和 AT (6.9) 
称 4 的 分 量 A1 ,Xs，,… ,7, 为 检验 数 . 对 应 基 变 量 的 检验 数 必 为 0. 检验 数 是 相对 于 给 定 的 基 
本 可 行 解 , 目 标 函 数 化 简 后 (不 含 基 变 量 ) 的 表达 式 中 的 系数 , 式 (6. 9) 也 称 作 简化 的 目标 
函数 . 
记 B-1A=(@y)nxn, P=B1P;= (0. a )T (SI<n), B=B-16. 
定理 6.3 给 定 基 本 可 行 解 z” ,如 果 所 有 的 检验 数 大 于 等 于 0, 则 x" 是 最 优 解 ,如 果 
存在 一 个 检验 数 和 二 0 且 所 有 aa 二 0(1 志 i 二 mm) , 则 无 最 优 解 . 
证 ”如果 所 有 的 检验 数 大 于 等 于 0, 注意 到 任意 可 行 解 + 宇 0, 由 式 (6.9) ,xz 的 目标 函数 
值 > 都 大 于 等 于 zo, 故 zx 中 是 最 优 解 . 
如 果 存 在 一 个 检验 数 A 二 0(X4 必 是 式 (6.9) 中 非 基 变量 的 系数 ) 且 所 有 ax 志 0(1<i< 
m) , 取 x 一 M>0, 其 余 非 基 变 量 zx; 一 0, 代入 式 (6.7) 解 得 
Xe) 一 及 一 aaM 二 0 1<i<m 
这 是 一 个 可 行 解 ,其 目标 函数 值 为 
x 一 xo 十 MkM 
当 M 于 ,> 下-m 得 证 无 最 优 解 . 
除去 定理 6. 3 中 的 两 种 情况 , 剩 下 的 第 三 种 情况 是 存在 一 个 检验 数 44 二 0 且 aa (1<i 二 
m) 不 全 小 于 等 于 0. 这 时 要 进行 基 变换 . 


6.3.3 基 变 换 


设 和 二 0 且 ou 之 0, 对 应 的 zx 必 是 非 基 变量 .进行 基 变 换 ,用 非 基 变量 x 替换 基 变 量 
zxr(0 ,得 到 新 的 基 了 B 二 (Pro,…, Peo-p，Pi, Peotv，…，Prcm), 即 用 Pi 替换 B 中 的 
Pr 称 x 为 换 入 变量 ,xx 为 换 出 变量 . 

首先 要 证 如 ' 确 实 是 一 个 基 , 即 也 -0 ，…， 了 -ce-D，Pe ,Pet+D ，… ,Pom 是 线性 无 关 的 . 
由 于 Pi ，Pxe)，"… ,Prcm) 是 线性 无 关 的 , 只 需 证 Po 可 表 成 Piro，,…, Prc-p， Pi， 
Po+b，…, Pen 的 线性 组 合 . 由 于 (Po ,Po ,……,Pxow ) 一 也- 了 B 一 已， 


P‘= 3 
两 边 同 乘 B, 得 到 
P, = Ss 
解 得 加 
Bas = i SP 
且 天 /上 


因此 ,B “确实 是 一 个 基 . 


令 


线性 规划 


Qmk 1 
第 ! 列 
瓦 是 把 单位 矩阵 的 第 / 列 换 成 P4. 由 上 面 已 的 表达 式 , 有 B'= 王 BH. 于 是 ， 
BAz = Bb 
可 写成 
HB-Az = HB-0 = HB 
即 , 把 基 变 量 zxco 换 成 非 基 变量 xx 相当 于 用 互 “: 乘 式 (6.5) 的 两 边 . 而 


1 一 aak/au 


1 一 art/au 
= l/an 


QH /au 1 


— am /an 1 
第 4 列 
故 用 态 ! 乘 式 (6.5) 的 两 边 就 是 将 式 (6.5) 中 的 第 /个 方程 除 以 aw ,第 i 个 方程 减 第 / 个 方 
程 的 ai/an 信 (1 二 im 且 i 丸 ). 这 样 做 的 结果 是 把 式 (6. 5) 中 第 /个 方程 中 xz, 的 系数 变 成 
1, 再 消去 其 他 方程 中 的 x. 计算 公式 如 下 ， 
y= y/o y l<j<n 
asy= Qay — aay /ans l1<i<m 有 8 有 iN, 1<j<n 
P= Bi/an 
B= B —aaBi/an, 1<i<m 且 ix 
要 保证 B' 是 可 行 的 ,只 需 
B=B—arpi/an 0,，1 志 i 鞠 且 i 汶 
注意 到 8. 宇 0,B, 宇 0,an 记 0, 当 ax 三 0 时 不 等 式 自然 成 立 . 于 是 ,只 需 当 由 过 0 时 


(6. 10) 


因此 ,应 取 /使 得 
min| 


对 式 (6.9) 也 做 类 似 的 变换 , 减 去 式 (6. 5) 中 第 ! 个 方程 的 At/ax 倍 ,消去 式 中 的 zx ,得 
到 关于 新 基 B" 的 简化 目标 函数 . 


B: 


a 


we Oy 1<i<m)] (6. 11) 
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SE Rs lj<n GB 
o= zo hsBi/an 

算法 6.1 单纯 形 法 . 

1. 设 初 始 可 行 基 B 王 (Po ,Po ,… ,Piem),a==B 1A,p 二 B71b,AT=cT—chB A,zo=chB lb. 

2. 车 所 及 宇 0(1 志 j 二 ) , 则 rs 一 B.zw 一 0 是 最 优 解 ,计算 结束 . 

3. 取信 二 0. 车 所 有 ax 三 0(1 志 i 过 m) , 则 无 最 优 解 ,计算 结束 . 

4. 取 /使 得 

Bh 


Qn 


B 


5. 以 xz 为 换 和 变量 xeon 为 换 出 变量 做 基 变 换 . 

6. 转 步骤 2. 

前 面 的 讨论 都 是 针对 最 小 化 .对 于 最 大 化 的 计算 ,只 需 进行 如 下 修改 : 如 果 所 有 的 
二 0(1 志 jm) , 则 当前 的 基本 可 行 解 是 最 优 解 ; 如 果 存 在 二 0 且 所 有 的 ax 志 0(1<i 寺 
m) , 则 无 最 优 解 ; 否则 进行 换 基 变 换 , 设 A 二 0 且 1 满足 式 (6.11), 取 x 作为 换 入 变量 ,zx 
作为 换 出 变量 . 


6.3.4 单纯 形 表 


将 式 (6.5) 和 式 (6.9) 中 的 系数 列 成 表格 , 称 作 单纯 形 表 . 单纯 形 法 的 计算 可 以 在 单纯 
形 表 上 进行 . 单纯 形 表 如 表 6. 2 所 示 . 


= min| i >9} 


表 6.2 单纯 形 表 
cl cz c 
0 
CB TB b T1 Tz EE 
Ca(l) Txt1) 所 an aa Qn 
Crt2) Tec2) 应 azl az aa， 
Crtm) tm) Bb ml am2 加 mn 
一 多 一 20 人 1 Maz A 


这 里 把 式 (6. 9) 改 写成 


j=1 
其 中 也 被 看 成 与 zj 一样 的 变量 . 这 样 一 来 ,在 形式 上 把 式 (6.9) 和 B-!Az=B-10 中 的 
方程 


Pars =B 

J 
统一 起 来 了 . 表 头 为 cs 的 列 简 称 cs 列 ,其 余 各 列 也 与 此 类 似 . 表 中 zs 列 与 b 列 给 出 当前 的 
基本 可 行 解 中 基 变 量 的 值 . 在 中 间 Qi 部 分 ,za » Tx (2) ，…… Xzcm) 列 恰好 构成 单位 矩阵 ,对 应 
的 hrcw 一 0. zo 等 于 cg 列 与 b 列 中 各 对 数 的 乘积 之 和 ,Aj 等 于 cj 减 ca 列 与 x; 列 中 各 对 数 的 
乘积 之 和 . 


线性 规划 


每 一 次 循环 对 单纯 形 表 进 行 如 下 运算 : 如 果 所 有 的 入 宇 0., 则 当前 的 基本 可 行 解 是 最 优 
解 ,计算 结束 . 如 果 存 在 XA4 二 0, 若 所 有 az 三 0(1 志 i 过 mm) , 则 无 最 优 解 ,计算 结束 . 否则 ,对 每 
一 个 ax 记 0, 把 9: 二 B/ax 填 和 人 9 列 . 当 aa 二 0 时 9 列 的 值 为 空 . 设 0. 最 小 , 则 在 a 上 加 圈 , 取 
Zz 作为 换 入 变量 ,zw 作为 换 出 变量 . 第 1 行 (不 含 ciw 和 ziow ,以 下 相同 ) 除 以 a ,第 i 行 减 
第 1/ 行 的 ax 售 ,把 ai 消 成 0(1 志 i<m 且 i 丸 ); 最 下 面 的 一 行 减 第 ! 行 的 人 % 倍 ,把 入 消 成 0. 
最 后 ,把 xs 列 的 zow 换 成 zi ,cap 列 的 crcw 换 成 cs. 这 就 得 到 关于 新 可 行 基 的 单纯 形 表 , 转 入 
下 一 次 循环 . 当 有 多 个 4 二 0 时 ,通常 取 使 |44 | 最 大 的 zs 作 为 换 入 变量 . 直观 上 ,这 样 做 可 
以 使 目标 函数 值 下 降 最 大 . 

下 面 继续 6. 3. 1 节 中 例子 的 计算 , 见 表 6. 3. 由 于 初始 可 行 基 是 单位 矩阵 , 故 初始 单纯 
形 表 中 的 数据 都 是 原始 数据 ,每 个 必 一 c. 基 变 量 为 zs ,zi4 ,zs. 

第 一 次 基 变 换取 zs 作为 换 入 变量 ,zs 作为 换 出 变量 . 第 二 次 基 变 换取 zi 作为 换 入 变 
量 ,z, 作 为 换 出 变量 . 最 优 解 zx* = 二 (120,180,0,0,20), 最 优 值 =* = 一 4140. 这 个 结果 与 
6. 1.2 节 中 用 图 解法 得 到 的 结果 是 一 样 的 . 松弛 变量 x3? = 过 = 二 0 说 明 最 优 解 使 例 6. 1 中 前 
两 个 约束 的 等 式 成 立 , 称 这 种 约束 为 紧 约 束 . x? = 二 20 说 明 第 3 个 约束 不 是 紧 约 束 ,原料 
3 尚 有 余 量 50 一 0.25X120 一 20. 


第 
6 
章 


表 6.3 
一 2 一 15 0 0 0 
Ch TH b Tl x: Ty Ta Xs 
0 Ty 120 0.25 0. 50 1 0 0 240 
0 | 150 0.5 0. 50 0 1 0 300 
0 Ts 50 0.25 0 0 0 1 
一 过 0 12 一 是 0 0 0 
一 15 2 240 0. 50 1 2 0 0 480 
0 XT 30 0 = 1 0 120 
0 es 50 0.25 0 0 0 1 200 
一 染 3600 —4.5 0 30 0 0 
一 15 2 180 0 最 4 = 0 
于 Tl 120 1 0 一 4 4 0 
0 Zs 20 0 0 1 = | 
一 多 4140 0 0 12 18 0 


例 6.9 用 单纯 形 法 解 下 述 线性 规划 . 
min z = Xi — 2xs 
Bt — WE Sd 
—2%i T+ < 4 
N20 和 守 0 
解 引入 两 个 松弛 变量 zs ,zs ,得 到 以 下 标准 形 
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We 
取 zs ,zx 作为 基 变 量 ,计算 如 表 6.4 所 示 . 由 于 3 过 0 且 an== 一 1<0,am= 二 一 2 过 0, 故 
目标 函数 值 没有 下 界 ,无 最 优 解 . 


表 6.4 
一 2 0 0 
0 
cB XB b Xl 工 Ts Th 
0 zs 1 1 一 1 1 0 
0 rh 4 一 二 [0 0 1 4 
一 z 0 1 一 2 0 0 
0 i 5 一 1 0 1 1 
一 各 rs 4 于 1 0 1 
一 8 一 臣 0 0 2 


6.3.5 人 工 变量 和 两 阶段 法 
在 6.3.1 节 中 只 介绍 了 对 最 简单 的 情况 确定 初始 可 行 基 的 方法 . 除 约 束 条 件 为 
De < bi(b; 宇 0) 外 ,还 有 两 种 情况 : 


Gl Sa 之 4 
i=1 


(2) Sg = b; 
其 中 已 三 0. 对 于 情况 (1) ,可 以 引入 剩余 变量 把 它 转 化 成 情况 (2). 因此 ,只 需 考虑 情况 (2)， 
为 此 引入 人 工 变量 y; 宇 0, 把 情况 (2) 变 成 
Parr ts 二 =b 
并 取 所 有 的 松弛 变量 和 人 工 变 基 作为 基 变 量 ， 得 到 初始 可 
例 6.10 考虑 下 述 线性 规划 : 


iin 过 一 一 321 十 2 十 zs 

一 2 11 
— di 二 Zs 六 33 CB 1 
一 2z 十 zs 一 1 


石 世 0， 了 = 1,2,3 
引入 松弛 变量 x ,剩余 变量 zs .得 到 问题 的 标准 形 : 


min z 一 一 3zl 十 zs 十 zs 
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本 一 一 11 
一 六 调和 十 加 证 名 一 Z5 一 3 (6.14) 
— a 丰 ws 


sO j= lg 
再 对 第 2 和 第 3 两 个 等 式 引 入 人 工 变量 ze 和 zi ,约束 条 件 转化 为 


Ti— 2zs 十 x 十 心 = 11 
一 Ew 和 二 253 一 5 十 部 一 3 ¢6, 153 
— 2x1 十 zs 十 2 一 1 


六 之 0， 了 一 1,2,…,7 
取 ziyze,zy 作为 基 变 量 ,得 到 式 (6. 15) 的 一 个 基本 可 行 解 为 zx 一 (0,0,0,11,0,3,1)7. 
问题 是 这 个 解 不 是 式 (6. 14) 的 可 行 解 . 为 了 使 它 成 为 式 (6. 14) 的 解 ,人 工 变量 必须 为 
0. 为 此 ,需要 引入 一 个 辅助 问题 . 
设 问 题 
minz= a 


St, Dasri =b, 1l1<i<m (6. 16) 
j=1 


zj 宇 0,， 1<j<<n 
其 中 4b; 宇 0(1 志 im). 引入 人 工 变量 yy ,… ,yw ;辅助 问题 为 


min w = Dy; 
i=1 
st, Dhaszity =b, 1<i<m (6.17) 
j=1 


二 ET 
0 了 有 全 

由 于 ww>0 ,辅助 问题 (6.17) 必 有 最 优 解 . 设 最 优 解 为 (zx? … ,zi ,y?，…,y*) ,最 优 值 为 
w* ,有 3 种 可 能 : 

(1) w* 二 0. 此 时 , 原 问题 (6. 16) 无 可 行 解 . 

假如 不 然 , 设 (z1,… ,zx,)" 是 原 问题 (6. 16) 的 可 行 解 , 则 (zi,….z 0,…,0)7 是 辅助 问 
题 (6.17) 的 可 行 解 ,对 应 的 w=0. 与 记 * 二 0 矛盾 . 

(2) 在 最 优 解 中 所 有 的 人 工 变 量 都 是 非 基 变量 . 此 时 ,yi = 二 …= 二 y= 二 0,w* 二 0， 
(zx? ,… ,x )T 是 原 问 题 (6.16) 的 基本 可 行 解 . 

(3) w* 一 0, 但 基 变 量 中 含有 人 工 变量 . 这 种 情况 可 以 进一步 转化 成 情况 (2). 

此 时 , 必 有 yr = 二 … 二 xy* 二 0. 设 是 基 变 量 , 在 式 (6. 6) 中 


9 于 ee 生 Fay 一 0 
sh Ee 
且 yi 不 出 现在 其 他 约束 等 式 中 . 若 所 有 oj 二 0(1 志 jn) , 则 表明 原 问 题 中 mx 个 约束 等 式 不 
是 线性 无 关 的 ,可 以 把 这 个 等 式 删 去 . 这 样 就 删 去 了 w. 否则 ,存在 某 个 az #0( 可 正 可 负 ). 


志 口 器 


算法 谈 计 与 分 胡 ( 血 2 版 ) 


用 xz, 作为 换 和 人 变量 ,ys 作为 换 出 变量 ,进行 基 变 换 . 由 于 B= 二 0, 经 过 基 变 量 ,B 的 所 有 值 均 不 
改变 ,从 而 新 的 基本 解 是 可 行 解 且 w==0 不 变 . 总 之 ,都 可 以 使 基 变 量 中 的 人 工 变 量 少 一 个 ， 
且 保 持 w==0 不 变 . 重复 进行 ,最 终 总 能 变 成 情况 (2). 
因此 ,辅助 问题 最 终 只 有 两 种 可 能 , 即 (1) 和 (2). 

上 述 讨论 给 出 了 当 有 宇和 三 的 约束 条 件 时 ,构造 初始 基本 可 行 解 的 方法 . 

两 阶段 法 

阶段 一 : 引入 人 工 变量 , 写 出 原 问 题 (6. 16) 的 辅助 问题 (6. 17) ,用 单纯 形 法 解 辅助 问 
题 . 若 为 情况 (1) , 则 原 问 题 无 可 行 解 ,计算 结束 ; 若 为 情况 (2) , 则 进入 阶段 二 . 

阶段 二 : 删 去 人 工 变量 ,得 到 原 问题 的 一 个 基本 可 行 解 . 以 这 个 解 为 初始 基本 可 行 解 ， 
用 单纯 形 法 解 原 问 题 . 

例 6. 10( 续 ) 用 两 阶段 法 . 阶段 一 ,问题 (6. 14) 的 辅助 问题 为 


min 记 一 6 十 27 

8 出 ZI 一 2zz 十 zs + zs 一 式 
一 mi 十 23 二 2z5 — 2 rg | 
一 2z 让 十 Zr 一 1 


而 区 0 了 三 15202717 
计算 过 程 见 表 6. 5， 有 两 点 需要 注意 . 其 一 ,对 引入 了 松弛 变量 的 约束 等 式 , 不 需要 引入 人 
工 变量 ,如 第 1 个 等 式 . 取 所 有 的 松弛 变量 和 人 工 变量 作为 初始 基 变量 . 其 二 ,cs 不 全 为 零 ， 
初始 单纯 形 表 中 的 4 值 必须 根据 式 (6. 8) 计 算 . 最 后 的 结果 是 ,ww" = 二 0, 最 优 解 xm 一 (0,1， 
1,12,0,0,0)T". x 的 基 变 量 是 zx, ,zs ,xs ,不 含 人 工 变量 . 


表 6.5 
0 0 0 0 0 1 1 
0 
cB TB b Tl Ts Ts Th Xs Te 27 
0 zh 11 1 一 条 1 0 0 0 11 
1 ze 3 —4 1 2 0 = 1 0 Ls 
1 7 1 = 0 (0) 0 0 0 k 
—w 一 6 一 二 一 家 0 0 0 
0 x 10 3 一 条 0 0 0 = 六 一 
1 zs 1 0 ©- 0 0 == 1 一 过 1 
0 zs 1 = 0 1 0 0 0 1 = 
—w 一 0 = 0 0 1 0 3 
0 ra 12 0 0 | 一 区 2 -者 
0 zy 1 0 1 0 0 一 这 1 = 失 
0 击 1 "“ 0 1 0 0 0 1 
—w 0 0 0 0 0 0 1 1 


线性 规划 


阶段 二 , 删 去 zx” 的 最 后 两 个 分 量 . 仍 记 作 zx" , 它 是 原 问题 (6. 14) 的 基本 可 行 解 .以 
2z@) 为 初始 基本 可 行 解 继续 计算 原 问 题 (6. 14). 初始 单纯 形 表 可 通过 如 下 改造 表 6. 5 中 最 
后 一 张 单 纯 形 表 得 到 : 删 去 人 工 变 量 zs ,zz 的 列 , 将 第 1 行 和 cs 列 中 的 数 换 成 问题 (6. 14) 目 
标 函 数 中 的 系数 ,把 最 后 一 行 中 的 w 改 成 = 并 重新 计算 <。 和 所 有 的 值 . 见 表 6. 6. 最 后 的 
结果 是 ,最 优 解 zx* 一 (4,1,9,0,0)7, 最 优 值 =* 一 一 2. 式 (6. 13) 的 最 优 解 是 x? = 二 4,zx2 二 1， 
好 一 9, 最 优 值 >* = 一 2. 
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表 6.6 
一 各 1 1 0 0 
0 
cB XB b Tl Tz Xs Ta Ts 
0 Th 12 四 0 0 1 一 2 4 
1 T2 1 0 1 0 0 加 六 和 
1 Ts ll 一 3 0 1 0 0 一 
一 多 = = 0 0 0 
=— Tl 4 i 0 0 1/3 一 2/3 
1 Ts 1 0 E 0 0 = 
1 3 9 0 0 1 2X3 一 4/3 
一 多 2 0 0 0 1/3 1/3 
例 6.11 解 线 性 规划 
min z = 3x1 — 2xs 
EF 玉林 站 雪人 4 
i 


元 20 元 志和 
解 ”引入 松弛 变量 zs 和 剩余 变量 x ,标准 形 为 


min zx 一 3zi 一 2zz 
2 一 4 
Ti— 一 = 二 3 


zi0, j=1,2,3,4 
用 两 阶段 法 . 
阶段 一 ,引入 人 工 变量 zs ,辅助 问题 是 
minw—= ZXs 
[a 一 4 
一 2 一 十 Xs 二 3 
Xi 宇 0， j= 二 1,2,…,5 
辅助 问题 的 计算 见 表 6.7. 计算 结果 是 ,w* 二 1 二 0. 原 问 题 无 可 行 解 . 


站 法 恰 计 与 分 新 ( 黎 2 版 ) 


表 6.7 
0 0 0 0 二 
0 
cB XB b Re rz Xs Xa 5 
0 rs 4 © 1 1 0 0 2 
1 rs 3 i > 0 = . 3 
—w 一 名 = 1 0 1 0 
0 Tl 2 1 1/2 1/2 0 0 
1 Ts 1 0 -82 —1/2 = 1 
一 入 一 站 0 3/2 好 a 0 
例 6.12 解 线性 规划 
min zx = Zi 十 3zz 一 2zs 
s. t。3Z1 十 6z? 十 2z: 一 了 一 12 
2z 二 5 一 4 
3T1 一 6xs 十 Xs 十 Zi 一 0 
zi 宇 0， 1j 二 4 
解 ” 用 两 阶段 
阶段 一 : 引入 人 工 变量 zs ,ze 和 zi ,辅助 问题 如 下 : 
min 一 Xs 十 Xe 十 zx? 
St 3m 二 62 274— TT xs 12 
2zi 二 站 ,8 一 4 
3 一 人 二 十 zy 一 0 


zi 之 0， 


1 


计算 列 于 表 6. 8. 结果 是 ,ww* ==0, 但 基 变 量 中 含 人 工 变 量 zs. 注意 到 ,zs 所 在 行 (第 1 
行 ) 原 有 变量 的 系数 全 为 0,a 王 az 二 a 二 aw 王 0, 及 也 一 定 等 于 0. 这 说 明 原 来 的 3 个 约束 


等 式 不 是 线性 无 关 的 ,第 1 个 可 以 表 成 另外 两 个 的 线性 组 合 . 实际 上 ,第 1 个 等 于 第 2 个 的 
3 倍 减 第 3 个 . 因此 ,可 以 删 去 第 1 个 约束 等 式 . 
表 6.8 
0 0 0 0 1 | 1 
0 
cB ZB b zl Zs Zs 4 Zs x 7 
| rs 12 3 6 ] 二 六 1 0 0 4 
1 ze 4 0 1 0 0 1 0 2 
1 ry 0 ©® - 坟 1 1 0 0 1 0 
—w | 一 16 一 各 0 一 和 0 0 0 0 
1 站 12 0 12 1 = 训 1 0 | 1 


线性 规划 


续 表 a 
6 
0 0 0 0 1 1 | 章 
cB Tp b Xl 2 Ta Ta rs Xs Z7 
1 Te 4 0 @ 二 0 一 到 3 1 
0 zl 0 1 =2 3 1/3 0 0 1/3 一 
—w 一 16 0 一 16 ”一 4/3 8/3 0 0 8/3 
1 rs 0 0 0 0 0 1 一 3 1 
0 Tz 1 0 1 1/12 ”一 1/6 0 1/4 一 1/6 
0 zl 此 1 0 Te 0 0 1/2 0 
—w 0 0 0 0 0 0 4 0 


阶段 二 : 删 去 表 6. 8 中 最 后 一 张 单纯 形 表 中 人 工 变量 x ,zs 和 xz; 的 列 以 及 zs 所 在 的 
行 , 修 改 诸 c; 和 cs 中 的 数 ,并 重新 计算 z。 和 诸 为 的 值 , 得 到 这 个 化 简 后 的 原 问 题 的 初始 单纯 
形 表 , 见 表 6. 9. 最 后 结果 是 ,最 优 解 为 立 二 0,zx2 二 2/3,x3 一 4 一 0, 最 优 值 为 =” 一 
= 


表 6.9 
1 3 #3 0 
0 
CB TB b Zi 2 Xs a 
3 ? 1 0 1 1/12 bi 12 
1 dl 2 4 0 0 1 
2 5 0 0 -A 1/2 
3 Tz 2/3 一 | 0 下 
一 总 Xa 4 2 0 1 0 
到 6 11/2 0 0 1/2 


例 6.13 解 线性 规划 


mn = wo 


和 6zi 十 3z 一 4zs 十 3z 一 12 
一 十 3z 一 6 
6z 上 4xs 二 3x4 二 0 


wy 网 二 太 运 泛 

解 ”用 两 阶段 法 . 

阶段 一 : 引入 人 工 变量 x; ,xs 和 zi ,辅助 问题 的 计算 如 表 6. 10 所 示 . 在 表 中 倒数 第 2 
个 单纯 形 表 已 得 到 最 优 值 ww* =0. 但 基 变量 中 含 人 工 变量 zo. 再 看 xs 所 在 行 , 原 有 变量 的 
系数 不 全 为 0,azs 二 一 5/2. 取 zs 作为 换 和 人 变量 ,zs 作为 换 出 变量 ,做 基 变 换 . 在 新 的 基 下 ， 
最 优 值 不 变 , 基 变 量 为 zi .zs 和 xz, 不 再 含 人 工 变量 . 转 人 阶段 二 . 


熙 法 证 计 与 分 新 (入 2 版) 


表 6.10 
0 0 0 0 上 L 时 
0 
ce XB b x1 Ts Ts Ts Xs Eg 
1 六 12 6 3 —4 3 和 0 0 4 
事 Xs 6 0 一 阳 0 3 0 1 0 2 
1 zx 0 一 6 0 4 © 0 0 1 0 
一 也 一 18 0 一 2 0 一 9 0 0 0 
A 也 12 也 3 一 8 0 1 0 = 1 
il Xe 6 6 = —4 0 0 p -= 下 
0 Ta 0 一 上 0 4/3 | 0 0 1/8 = 
Ww 18 18 多 12 0 0 0 3 
0 而 1 1 1/4 —2/8 0 1/12 交 一 这 
1 Zs 0 0 0 0 一 172 1 yg 
0 Xs 2 0 1/2 0 1 1/6 0 1/6 
项 0 0 5/2 0 0 3/2 0 3/2 
0 Zl 1 1 0 2/3 0 1/30 1/10 2/15 
0 Tz 0 0 » 0 0 1/5 —2/3 1/5 
0 x 2 0 0 0 1 1/15 1/5 1/15 
一 她 0 0 0 0 0 1 1 和 


阶段 二 : 删 去 所 有 人 工 变 量 , 得 到 原 问题 的 一 个 基本 可 行 解 . 计算 它 的 检验 数 ,发 现 它 
已 是 原 问题 的 最 优 解 ,x? ==1,zx2 = 二 0,x3 二 0,zx7 = 二 2, 最 优 值 2* = 一 1, 见 表 6. 11. 


表 6.11 

1 | 1 = 二 
0 

cB rp b Tl T2 Ts Te 
1 zl 1 1 0 一 和 好 0 
1 zz 0 0 1 0 0 
| zs 2 0 0 0 1 
一 多 1 0 0 2/3 0 


6.3.6 单纯 形 法 的 有 限 终 止 


定义 6.2 如果 基本 可 行 解 中 基 变 量 的 值 都 大 于 0, 则 称 这 个 基本 可 行 解 是 非 退 化 的 ， 
否则 称 作 退化 的 . 

如 果 线 性 规划 的 所 有 基本 可 行 解 都 是 非 退 化 的 , 则 称 这 个 线性 规划 是 非 退 化 的 . 

如 果 线 性 规划 有 可 行 解 并 且 是 非 退 化 的 , 则 在 计算 的 每 一 步 ,: 所 有 及 一 六 /之 0. 根据 


线性 规划 


式 (6. 12) ,zi 一 zo ,每 一 次 基 变 换 都 使 目标 函数 值 严格 下 降 ,从 而 在 计算 过 程 中 可 行 基 不 会 
重复 出 现 , 因 此 单纯 形 法 一 定 会 在 有 限 步 内 终止 . 

如 果 线 性 规划 不 是 非 退 化 的 : 当 及 =0 且 取 zw 为 换 出 变量 时 , 基 变 换 不 改变 目标 函数 
值 . 这 就 可 能 使 计算 出 现 循环 ,计算 永 不 终止 . 1955 年 E. Beal 给 出 如 下 一 个 例子 ， 
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min z 一 一 十 20 志 一 ye 二 6x4 
4 2 
Wt +n —8zxs — zs 9 rs 一 0 
1 一 29 一 有 忆 才思 一 0 
2 1 2 3 4 6 
Xa 十 Zr 一 1 


0 
取 zi,zsyzy 作 为 初始 基 变量 ,并 规定 : 当 有 多 个 和 二 0 时 , 设 | 和 | 二 max{ Xj|: 二 0), 取 江 。 
作为 换 入 变量 ; 当 有 多 个 0: 同时 取 到 最 小 值 时 , 取 对 应 的 下 标 最 小 的 基 变 量 作为 换 出 变量 . 
计算 经 过 6 次 基 变 换 回 到 初始 可 行 基 , 从 而 计算 出 现 循环 , 永 不 终止 . 

问题 出 在 ,单纯 形 法 没有 明确 规定 , 当 有 多 个 二 0 时 ,如 何 选取 换 入 变量 ; 当 有 多 个 & 同 
时 取 到 最 小 值 时 ,如 何 选取 换 出 变量 . 为 了 避免 循环 ,1954 年 G. B. Dantzigt 提出 字典 序 方法 . 
1977 年 R. G. Bland 又 提出 避免 循环 的 两 条 十 分 简单 的 规则 ,下面 叙 述 Bland 的 规则 ,证明 从 略 . 

Bland 规则 

规则 1: 当 有 多 个 心志 0 时 , 取 对 应 的 非 基 变 量 中 下 标 最 小 的 作为 换 入 变量 . 

规则 2: 当 有 多 个 4=B/ax (ax 二 0) 同 时 取 到 最 小 值 时 , 取 对 应 的 基 变 量 中 下 标 最 小 的 
作为 换 出 变量 . 


6.4 对 偶 性 


6.4.1 对 偶 线性 规划 


回 到 例 6. 1 ,现在 有 另 一 家 B 公司 急需 这 3 种 原料 ,打算 向 A 公司 购买 ,问题 是 应 出 什 
么 价钱 . 设 B 公司 出 的 价钱 是 原料 1 每 吨 yi 万 元 ,原料 2 每 吨 ys 万 元 ,原料 3 每 吨 ys 万 元 . 
显然 ,不 能 低 于 A 公司 用 这 些 原料 生产 清洁 剂 所 产生 的 价值 ,否则 A 公司 是 不 可 能 出 售 的 ， 
故 必 须 满足 


0. 25y: 十 0. 50y? 十 0. 25ys 之 12 

0. 50yi 十 0. 50yz 之 15 
同时 ,B 公司 又 希望 总 购买 费用 最 小 , 即 

min w= 120y1 十 150y; 十 50y3 


综合 上 述 结果 ,并 与 例 6. 1 中 的 线性 规划 并 列 于 下 : 
(1) max < 一 12zi 十 15z2 (2) min w= 120y1 十 150ys 十 50ys 
s. t. 0. 25zi 十 0. 50zs 魏 120 s.t. 0. 25y 十 0. 50y: 十 0. 25ys 之 12 
0. 50zxi 十 0. 50zz 魏 150 0. 50yi 十 0. 50ys 之 15 
OQ: 25 50 N10， y% 二 0， ys 宇 0 


Xi 宇 0， zs 宇 0 


莫 法 讼 计 与 分 新 (入 2 版 ) 


这 两 个 线性 规划 有 下 述 特点 : (2) 中 的 变量 数 等 于 (1) 中 的 约束 不 等 式 的 个 数 , (1) 
中 的 变量 数 等 于 (2) 中 的 约 东 不 等 式 的 个 数 ; 约 东 不 等 式 中 的 系数 矩阵 互 为 转 置 ; 目 
标 函 数 中 系数 cj 与 约 东 不 等 式 的 常数 项 六 相互 交换 ; 不 等 号 相反 ,max 配 达 ,min 配 宇 . 
称 (1) 为 原始 规划 ,(2) 为 (1) 的 对 偶 规 划 . (2) 的 最 优 解 y? ,y2 ,y3 称 为 这 3 种 原料 的 
影子 价格 . 当 市 场 上 该 原料 的 售 价 高 于 影子 价格 时 ,A 公司 可 以 直接 出 售 原料 获取 更 
多 的 价值 . 

定义 6.3 设 线 性 规划 


IC 
i (6. 18) 
人 0 
和 
minbTly 
Ss (6. 19) 
?之 0 
称 式 (6. 19) 是 式 (6. 18) 的 对 偶 线性 规划 ,简称 对 偶 或 对 偶 规 划 , 称 式 (6. 18) 为 原始 线性 规 
划 ,简称 原始 规划 ， 


定理 6.4 对 偶 的 对 偶 是 原始 线性 规划 . 
证 式 (6.19) 可 改写 成 
max 一 0Ty 


s.t. 一 ATy 扫 一 ce 


> 二 0 
根据 定义 6.3, 它 的 对 偶 为 
mn —éT 
SE CA 
Tr 宇 0 


这 等 价 于 式 (6. 18) ,得 证 式 (6. 19) 的 对 偶 是 式 (6. 18). 
定理 说 明 ,原始 规划 与 对 偶 规划 是 对 称 的 , 互 为 对 偶 . 
例 6.14 写 出 下 述 线性 规划 的 对 偶 . 
max 2 — ts + 3 
一 
= — Cy ss = 
Xi 宇 0， zs 宇 0， zs 任意 
解 令 zx 二 zi 一 心 ,又 等 式 A 二 B 等 价 于 两 个 不 等 式 A 三 B 和 一 A 一 B, 上 述 规 划 可 
写成 下 述 形式 : 
max 271 一 zz 十 37z3 一 37z4 
SB SS 
一 2 一 2zs 十 zz 一 2 二 8 
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zi 十 27zs 一 并 十 妈 近 一 8 
0 0 0 
对 偶 规划 为 
min 5 十 8y? 一 8y: 
st Wy 二 yz 过 2 
3 一 2y? 十 22% 之 一 1 
一 2y 十 ?2 一 六 之 3 


2y 一 2% 十 次 之 一 3 
N10,， yi0, W%0 
令 ys 三 ys 一 六 ,并 将 第 3 个 和 第 4 个 不 等 式 合并 成 一 个 等 式 , 得 到 
min 5y 十 8y 


2 一 2 过 2 
二 孝 3 天 一 2 克之 一 1 
一 2 十 yz 一 3 


.lL 三 0， a 任意 
现 将 这 一 对 规划 并 列 对 应 如 下 : 


原始 规划 对 偶 规 划 
max 2zi 一 Z2 十 37s min 5yi 十 8y 
击 十 3z 一 22<5 1 宇 0 
一 Zi 一 2zz 十 zs 一 8 yz 任意 
Zi 过 0 1 一 >2 
zs 宇 0 3 一 2y: 之 一 1 
zs 任意 一 2 十 y 一 3 
对 偶 规划 最 一 般 形式 如 下 
原始 规划 对 偶 规划 
max Doz; min Dboys: 
j=1 i=1 
Daszr; Sh, 1<i<s yi 宇 0, 1<i<s 
j=1 
Daszi =b, stl<Si<m yi 任意 ，s 十 1 二 im 
j=1 
0 le ays st Ly 
i=1 
名; 任意， z 和 十 1 寺 7 寺 n Dasyi = 0, tL sf 
i=1 


下 面 给 出 原始 规划 与 对 偶 规划 的 解 之 间 的 关系 . 
定理 6.5 设 z 是 原始 规划 (6.18) 的 可 行 解 ,y 是 对 偶 规划 (6. 19) 的 可 行 解 , 则 恒 有 


crzs 委 5ry 
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证 
cTz<(AITy)Tzr 一 yT(Az) 委 yT0 一 07y 
由 定理 6.5 可 立即 得 到 下 述 结论 . 
定理 6.6 如 果 x 和 y 分 别 是 原始 规划 (6. 18) 和 对 偶 规 划 (6. 19) 的 可 行 解 , 且 cTz 一 
py, 则 zz 和 > 分 别 是 原始 规划 (6.18) 和 对 偶 规 划 (6. 19) 的 最 优 解 . 
定理 6.7 ”如果 原 始 规划 (6. 18) 有 最 优 解 , 则 对 偶 规划 (6. 19) 也 有 最 优 解 , 且 它们 的 最 
优 值 相等 . 反之 亦 然 . 
证 引入 松弛 变量 ,将 原始 规划 (6. 18) 写 成 
max cz 
st Az+ Eu =b 
0 
这 里 A 是 m Xn 和 矩阵 ,EE 是 m Xm 单位 矩阵 ,wu 是 m 维 向 量 . 设 最 优 解 对 应 的 基 为 B, 其 基 
变量 zs 二 Bb, 检验 数 A 二 0( 注 意 这 是 最 大 化 问题 )， 把 4 分 成 两 部 分 ,对 应 z 的 部 分 X; 和 
对 应 的 部 分 4。. 根据 式 (6. 8) ,并 注意 到 在 目标 函数 中 的 系数 都 为 0, 有 
A =cT—cBB A<O 
A =— chBE =— cB "<0 


y 宇 0 
co—yA<o0 
即 
A'y 宇 ec 
从 而 y 是 对 偶 规划 (6. 19) 的 可 行 解 ， 又 


也 一 by 一 yTO 


b= cB = rs % 
即 z 和 y 的 目标 函数 值 相等 ,根据 定理 6.6,y 是 对 偶 规划 (6.19) 的 最 优 解 . 

由 原始 规划 和 对 偶 规划 的 对 称 性 (定理 6.4) ,反之 亦 然 , 即 如 果 对 偶 规划 (6. 19) 有 最 优 
解 , 则 原始 规划 (6. 18) 也 有 最 优 解 , 且 它 们 的 最 优 值 相 等 . 

如 表 6. 12 所 示 ,根据 定理 6.7. 第 1 行 和 第 1 列 中 除 (1) 外 的 其 他 4 种 情况 都 不 可 
能 ;根据 定理 6.5, 中 间 的 情况 也 不 可 能 出 现 . 因此 ,原始 规划 和 对 偶 规划 的 解 只 有 下 述 
3 种 情况 : 


表 6.12 
对 偶 规划 
有 最 优 解 有 可 行 解 且 无 界 无 可 行 解 
原始 规划 
有 最 优 解 (1) X x 
有 可 行 解 且 无 界 x x (2) 
无 可 行 解 x (2) (3) 


(1) 原始 规划 和 对 偶 规划 都 有 最 优 解 , 且 最 优 值 相等 . 
(2) 原始 规划 有 可 行 解 且 目标 函数 值 无 界 , 对 偶 规划 无 可 行 解 ; 或 者 对 偶 规 划 有 可 行 
解 且 目 标 函 数值 无 界 , 原 始 规划 无 可 行 解 . 
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(3) 原始 规划 和 对 偶 规 划 都 没有 可 行 解 . 
定理 6.8( 互 补 松弛 性 ) 设 z 和 y 分 别 是 原始 规划 (6. 18) 和 对 偶 规 划 (6. 19) 的 可 行 
解 , 则 xz 和 > 分别 是 它们 的 最 优 解 当 且 仅 当 


(6— Bass)ys =0, 1<i<m (6. 20) 
Fe 
© (Deyo) =0, 1l<j<n (6.21) 
i=1 
和 证 准 
二 = (& 一 Bese)ys, li<m 


ui 一 a( Da 一 5)， lI 
由 约 东 条 件 , 所 有 wi 宇 0(1 志 i 二 mm) ,vj 宇 0(1 声 j 志 mn). 于 是 , 式 (6. 20) 和 式 (6. 21) 成 立 当 且 
仅 当 


动员 市 Sa =0 
i=1 j=1 


3 守 pe > es Dear)y, 未 Pal Days -9) 
i=1 j=1 i=1 j=1 j i 
一 Doiy; Dex; 
i=1 j=1 


推出 式 (6. 20) 和 式 (6. 21) 成 立 当 且 仅 当 Sb = Da. 由 定理 6.6 和 定理 6.7, 这 又 当 
且 仅 当 zz 和 > 分 别 为 原始 规划 (6. 18) 和 对 偶 规 划 (6. 19) 的 最 优 解 . 
6.4.2 对 偶 单纯 形 法 


考虑 原始 规划 

min = 一 cz 

s.t. Az 一 0 《6. 22) 
过 学 油 

和 它 的 对 偶 

max ww 一 67y 

te MATYy (C6.23) 
y 任意 


设 B 是 式 (6. 22) 的 一 个 可 行 基 , 对 应 的 可 行 解 zs 二 B71b,zxn 二 0, 检 验 数 A7==cT 一 cB-1A， 
目标 函数 值 >。 二 cBB 7'b. 令 yr 二 cBB 1!, 恒 有 wo 二 by 二 y'0= 二 cBB 1b== zo. le 6.6, 只 
要 y 是 式 (6.23) 的 可 行 解 , 则 xz 和 y 分 别 是 式 (6.22) 和 式 (6. 23) 的 最 优 解 . 

又 由 和 一 cT 一 c3B-1A 一 cT 一 >TA, 有 yy 是 式 (6. 23) 的 可 行 解 后 ATy 委 c 以 过 0. 

设 B 是 一 个 基 , 如 果 4 宇 0, 则 称 B 是 正则 的 . 与 上 面 对 称 地 ,如 果 B 是 正则 的 ,那么 y 
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是 式 (6. 23) 的 可 行 解 ,从 而 只 要 工 是 式 (6. 22) 的 可 行 解 , 即 zs 一 B- 10 二 0, 则 zx 和 y 分 别 是 
式 (6. 22) 和 式 (6. 23) 的 最 优 解 . 

从 上 述 角度 看 ,单纯 形 法 是 保持 x 是 式 (6. 22) 的 可 行 解 (保持 B 是 可 行 基 ), 即 保持 
B-'b 宇 0, 通 过 基 变 换 使 y 逐步 成 为 式 (6. 23) 的 可 行 解 (B 变 成 正则 基 ) , 即 逐 步 使 * 宇 0. 对 
称 地 ,保持 y 是 式 (6. 23) 的 可 行 解 ( 保 持 B 是 正则 基 ) , 即 保持 4 宇 0, 通 过 基 变 换 使 x 逐步 成 
为 式 (6. 22) 的 可 行 解 (B 变 成 可 行 基 ), 即 逐步 使 B-'b 宇 0. 这 就 是 对 偶 单纯 形 法 . 


设 4 宇 0, 二 0, 若 所 有 oy 这 0(1 过 j<<n) , 则 不 存在 x 之 0 使 得 layx; = Bi, 式 (6.22) 无 
=1 


可 行 解 . 若 存在 wu 过 0, 则 以 zxow 为 换 出 变量 、zi 为 换 入 变量 做 基 变 换 , 必 须 保证 
N=N—Nhay/an 0, 1<j<n 
注意 到 Nj 宇 0,44 宇 0,an 二 0, 当 ay 宇 0 时 ,不 等 式 自然 成 立 . 于 是 ,只 要 当 a 一 0 时 ， 


故 应 取 上 使 得 


ai <o) (6. 24) 


算法 6.2 ”对偶 单 纯 形 法 . 

1. 取 正 则 基 B. 

2. 如果 8 二 0, 则 xz 是 最 优 解 ,计算 结束 . 

3. 取 及 一 0. 车 所 有 ay 宇 0(1 三 j 二 mn) , 则 无 可 行 解 ,计算 结束 . 
4. 按照 式 (6.24) 取 人 . 

5， 以 zxow 作 为 换 出 变量 、z 作 为 换 入 变量 做 基 变 换 . 

6. 转 步 又 2. 


在 下 一 节 整 数 线性 规划 的 分 支 限界 算法 中 将 要 用 到 对 偶 单 纯 形 法 ,在 那里 初始 的 正则 
基 是 自然 得 到 的 . 


6.5 整数 线性 规划 的 分 支 限界 算法 


如 果 在 线性 规划 上 对 变量 增添 整数 的 要 求 , 就 成 为 整数 线性 规划 . 整数 线性 规划 也 
同样 有 广泛 的 应 用 ,在 建 模 时 往往 要 求 某 些 变 量 是 整数 ,如 人 员 数 、 航 班次 数 、 集 装 箱 数 
等 , 整数 线性 规划 可 以 要 求 所 有 变量 都 是 整数 . 称 作 纯 整数 线性 规划 或 全 整数 线性 规划 ; 
也 可 以 只 要 求 部 分 变量 是 整数 , 称 作 混 合 整数 线性 规划 ; 还 可 以 要 求 变量 必须 是 0 或 1， 
称 作 0-1 型 整数 线性 规划 . 虽然 整数 线性 规划 与 线性 规划 的 差别 仅仅 是 对 变量 添加 了 
整数 要 求 ,但 却 难 计算 得 多 . 在 第 9 章 将 证 明 它 是 NP 完全 的 . 整数 线性 规划 的 内 容 十 
分 丰富 ,本 节 仅 通过 下 面 的 例子 简单 介绍 如 何 借助 线性 规划 ,用 分 支 限 界 法 解 整数 线 
性 规划 . 

删 去 整数 线性 规划 中 的 整数 要 求 所 得 到 的 线性 规划 称 作 它 的 松弛 规划 ,简称 松弛 . 松 
弛 规划 的 最 优 值 是 原 整数 规划 的 最 优 值 的 界限 (最 小 化 的 下 界 ,最 大 化 的 上 界 ). 但 是 ,松弛 
规划 的 最 优 解 通常 不 是 原 整 数 规划 的 最 优 解 .通过 四 舍 五 人 也 不 一 定 能 得 到 一 个 比较 好 的 
近似 解 ,甚至 根本 得 不 到 原 整数 规划 的 可 行 解 , 见 图 6. 4. 点 A 是 松弛 规划 的 最 优 解 ,B 是 
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原 整数 规划 的 最 优 解 ,二 者 相差 甚 远 . 不 管 对 点 A 的 坐标 如 何 取 整 ,都 不 能 得 到 原始 规划 的 
可 行 解 . 

整数 线性 规划 的 分 支 限 界 法 的 基本 做 法 如 下 : 记 整数 线性 规划 为 ILP, 它 的 松弛 规划 
为 LP. 如 果 LP 的 最 优 解 a 满足 整数 要 求 , 这 个 解 当然 也 是 ILP 的 最 优 解 . 否则 , 设 ai 不 是 
整数 ,在 LP 上 分 别 加 约束 条 件 zi 三 La | 和 zi 三 lm | 片 1, 得 到 两 个 子 问题 ,分 别 记 作 LP, 和 
LP:. 显然 ,LP; 和 LP: 的 可 行 域 包含 ILP 的 可 行 域 , 但 删 去 了 LP 的 可 行 域 中 位 于 直线 x 一 
La 和 zi 二 la 十 1 之 间 的 部 分 (不 包括 这 两 条 直线 ). LP 和 LP。 的 最 优 解 都 不 会 优 于 LP 的 
最 优 解 . 如果 LP 或 LP; 的 最 优 解 符合 整数 要 求 ,那么 这 个 解 也 是 ILP 的 可 行 解 , 从 而 得 到 
ILP 的 最 优 值 的 一 个 界限 (最 小 化 的 上 界 ,最 大 化 的 下 界 ) ,该 子 问题 的 计算 结束 .如 果子 问 
题 的 最 优 解 不 满足 整数 要 求 , 则 和 上 面 一 样 继续 分 支 ,得 到 两 个 子 子 问题 ,计算 继续 往 下 进 
行 . 如 果子 问题 的 最 优 值 超 过 界限 (最 小 化 大 于 界限 ,最 大 化 小 于 界限 ), 则 这 个 子 问题 往 下 
计算 不 可 能 得 到 ILP 的 最 优 解 , 计 算 结束 . 当 没 有 待 继续 计 算 的 子 问 题 时 ,所 有 可 行 解 中 最 
好 的 就 是 ILP 的 最 优 解 . 
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例 6.15 整数 线性 规划 


min z=—3z—5y 


| 一 xz 十 y 亏 沪 


2z 二 35 所 11 
ZX,y 宇 0， 整数 


记 整 数 线性 规划 为 ILP, 它 的 松弛 规划 为 LP. LP 的 最 优 解 mm 一 所 ,wm 一 芋 , 最 优 值 < 一 


_179 


10 ”在 图 6. 5 中 是 点 A，xzo ,yo 都 不 是 整数 . 任 取 一 个 ,如 取 ze ,添加 x 二 1, 得 到 子 问 题 


LP, ; 添加 x 这 2, 得 到 子 问 题 LP,. 分 别 解 LP 和 LP. LP 的 最 优 解 如 一 1 一 元 ,最 优 什 


i 时 i i 
避 一 一 时 ,是 点 BLP; 的 最 优 解 zs 一 2,y: 一 了 了 ,最 优 值 = 一 一 他 ,是 点 C. 由 于 zs<<, 先 


对 LP: 继 续 计 算 . zz 是 整数 ,y 不 是 整数 . 添加 y 二 2, 得 到 LPz; 添加 > 过 3, 得 到 LPzs. 


站 法 说 计 与 分 新 ( 黎 2 版 ) 


LPs 的 最 优 解 z 一 二 ,ya 一 2, 最 优 值 <a 一 一 各 是 点 D; LP, 无 可 行 解 .继续 LP。 ,添加 


ZX 二 2, 得 到 LP2aa; 添加 xz 之 3, 得 到 LPa.LP2a 的 可 行 域 是 点 下 下 面 的 直线 段 , 最 优 解 是 点 
尼 ,z2a 一 2,y2 一 2, 最 优 值 xm 一 一 16. 它 也 是 原 整 数 规划 ILP 的 可 行 解 ,同时 得 到 ILP 最 


优 解 的 上 界 4 二 一 16. 该 分 支 的 计算 结束 . LP2s 的 最 优 解 是 点 Fzaz 一 3,yos 一 三 ,最 优 值 


so 一 一 吧 . 继续 LPaz ,添加 y<1, 得 到 LPuors 添加 y 之 2, 得 到 LPass，LPaa 的 最 优 解 是 


点 G,zma 二 4, ya 二 1, 最 优 值 zzl21 二 一 17. 这 也 是 ILP 的 可 行 解 ,而 且 比 (xon ,yzn) 更 好 ， 
更 新 4 二 一 17. LP2s 的 计算 结束 . LPazs 无 可 行 解 . 至 此 ,LP; 下 面 的 分 支 计算 结束 . 转 到 
LP ,由 于 之 u, 不 再 继续 往 下 . 至 此 整个 计算 结束 ,最 优 解 为 x* 二 zw2 二 4,y* 二 ya 二 1， 
最 优 值 为 2" = 一 17. 计算 过 程 如 图 6. 6 所 示 . 


LP 
a=13/10 
145 
z=-179/10 


无 可 行 解 


LP212s 


= 无 可 行 解 


2 -17 


图 6.6 


计算 基本 上 是 解 一 个 一 个 的 线性 规划 . 每 一 个 线性 规划 是 在 上 一 个 结 点 的 线性 规划 
中 增加 一 个 约束 条 件 zx; 三 a 或 xz; 三 a. 引入 松弛 变量 或 剩余 变量 w, 把 不 等 式 转化 成 等 式 
Zi 十 U 二 a 或 一 zi 十 u 一 一 a; 因 此 要 在 上 一 个 结 点 的 线性 规划 的 最 终 单纯 形 表 中 添加 一 行 
和 一 列 . 但 这 还 不 是 该 线性 规划 的 初始 单纯 形 表 , 因 为 在 添加 的 行 中 x; 是 基 变 量 , 在 上 面 
的 行 中 已 经 出 现 . 设 x(1) 二 i, 减 或 加 第 / 行 ,消去 添加 行 中 的 zx;, 得 到 初始 单纯 形 表 ,u 是 
新 的 基 变 量 . 由 于 在 目标 函数 中 的 系数 为 0,x 的 检验 数 为 0, 其 余 的 检验 数 不 变 . 所 有 
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检验 数 仍 大 于 等 于 0, 但 wx 的 值 可 能 小 于 0, 用 对 偶 单纯 形 法 计算 . 下 面 以 图 6.6 中 LP， 
LP, ,LP, 和 LP: 的 计算 为 例 说 明 如 下 . 

表 6. 13 用 单纯 形 法 计算 LP. LP 添加 zx 十 w= 二 1 得 到 LP, ,相应 地 ,在 表 6. 13 的 最 终 单 
纯 形 表 中 添加 一 行 一 列 ,得 到 表 6. 14 的 第 一 张 表 . 第 3 行 减 第 2 行 ,消去 第 3 行 中 的 zx, 得 
到 表 6. 14 中 的 第 二 张 表 . 这 是 LP 的 单纯 形 表 ,4 宇 0, 是 正则 基 , 但 BB 二 一 0.3 二 0, 不 是 可 
行 基 , 用 对 偶 单纯 形 法 计算 . 表 6. 14 中 把 9 列 移 到 x 行 的 下 面 ,存放 /ay (ay 一 0). LP 的 
最 优 解 是 x= 二 1,y= 二 2.5, 最 优 值 = = 二 一 15. 5. 


表 6.13 LP 的 计算 


第 
6 
章 


一 过 一 5 0 0 
cB TB b T y ul Uz 0 
0 ul 1.5 EE. OO 1 0 1.5 
0 Us 11 2 3 0 1 11/3 
—z 0 -0 < 一旦 0 0 
一 5 芭 1.5 一 1 1 1 0 二 
0 us 6.5 © 0 = 这 1 1.3 
二 7.5 =8 0 5 0 
一 5 y 2.8 0 1 0.4 0.2 
一 和 4 1.3 1 0 一 0.6 0.2 
一 党 7: 身 0 0 0.2 1.6 


表 6.14 LP 的 计算 


—3 一 5 0 0 0 
(93 TB b 僚 y uu 4 由 
一 5 y 2.8 0 1 0.4 0.2 0 
一 3 加 1.3 1 0 一 0.6 0.2 0 
1 1 0 0 0 1 

一 = 17.9 0 0 0.2 1.6 0 

一 5 y 2.8 0 1 0.4 0.2 0 
一 3 z 了 1 0 一 0.6 0.2 0 
0 耶 一 0.3 0 0 0.6 1 
一 = 17.9 0 0 0.2 1.6 0 

8 8 一 

一 y 2 0 1 1 0 1 
= 者 z 1 1 0 0 0 1 
0 四 1.5 0 0 一 3 1 一 5 


—z 15.5 0 0 5 0 8 
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在 LP 上 添加 一 x 十 vs 二 一 2 得 到 LP; ,相应 地 在 表 6. 13 的 最 终 单纯 形 表 中 添加 一 行 一 
列 ,得 到 表 6. 15 的 第 一 张 表 . 第 3 行 加 第 2 行 ,消去 第 3 行 中 的 zx, 得 到 表 6. 15 中 的 第 二 张 
表 . 这 是 LP; 的 单纯 形 表 . 同样 地 ,4 宇 0, 但 == 一 0.7 二 0. 用 对 偶 单纯 形 法 计算 ,得 到 LP， 
的 最 优 解 zx 一 2,y 一 7/3, 最 优 值 zs 二 一 53/3. 


表 6.15 LP; 的 计算 


-= 一 5 0 0 0 
ch Xa b y uw wu vs 
一 5 y 这 0 1 0.4 0.2 0 
= zx 1.3 1 0 一 收音 0.2 0 

一 2 一 1 0 0 0 1 
二: 莹 1 0 0 多 2 1.6 0 
= y 2.8 0 1 0.4 O02 0 
一 3 让 1.3 L 0 = 0.2 0 
0 wh 一 0.7 0 0 CC0.67 0.2 
-家 17.9 0 0 0.2 工作 0 

0 -1/8 
二 和 y 7/3 0 1 0 1/3 2/3 
3 z 2 1 0 0 0 ] 
0 20 7/6 0 0 0 = 一 6 
= 区 53/3 0 0 0 5/3 173 


在 LP: 上 添加 一 > 十 wz 王 一 3 得 到 LP。 ,相应 地 在 表 6. 15 的 最 终 单 纯 形 表 中 添加 一 行 
一 列 ,得 到 表 6. 16 的 第 一 张 表 . 第 4 行 加 第 1 行 .消去 第 4 行 中 的 >, 得 到 表 6. 16 中 的 第 二 
张 表 , 这 是 LP: 的 单纯 形 表 . PB, 二 一 2/3 二 0 且 所 有 auj 伍 0(1 委 ) 委 6) , 故 LPzs 无 可 行 解 . 


表 6.16 LP 的 计算 


= 六 一 局 0 0 0 0 
cB zB b 7 y uu uz ve vz: 
一 二 y 7/3 0 1 0 1 2/3 0 
六 r 2 1 0 0 0 | 0 

0 wu 7/6 0 0 0 ee 一 1/6 0 
= 注 0 于 0 0 0 1 

一 = 53/3 0 0 0 5/3 1/3 0 
一 y 7/3 0 1 0 1/3 2/3 0 
= 济 2 1 0 0 0 一 沁 0 
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a = 0 0 0 0 章 
cB TB b 区 了 ul 和 ve Va: 
0 WU 7/6 0 0 0 一 JS = 0 
0 Uz 一 这 龙 0 0 0 Is 2/3 1 
一 53/3 0 0 0 /3 1/3 0 


习 题 6 


6.1 某 厂 生产 两 种 产品 ,每 件 产品 的 利润 分 别 是 85 元 和 70 元 . 产品 要 经 过 4 道 工 序 加 
工 , 每 件 产品 的 加 工时 间 和 每 周 可 用 的 工时 如 表 6. 17 所 示 . 


表 6.17 产品 加 工时 间 与 可 用 工时 


加 工时 间 /( 人 “小 时 / 件 ) 
工序 可 用 工时 /( 人 “小 时 ) 
产品 1 产品 2 

1 0.54 0.85 800 

2 0. 30 0.70 500 

3 1.05 0.55 900 

4 0.15 0a25 120 
写 出 下 列 问 题 的 数学 模型 : 
(1) 制定 一 周 的 生产 计划 ,使 总 利润 最 大 . 
(2) 部 分 工人 经 过 培训 掌握 2 个 或 3 个 工序 的 操作 ,从 而 当 需 要 时 可 以 调剂 到 其 他 工 


序 工 作 . 假设 可 能 调剂 的 情况 如 表 6. 18 所 示 . 
表 6.18 工序 调剂 


原 工 调 人 工序 最 大 调剂 工时 / 
序 1 2 3 (人 “小 时 ) 

1 | V V x 100 

2 JV 一 Nh 50 

3 x ~ Wy ~ 100 

4 x Xx J 40 

试制 定 一 周 的 生产 计划 及 工序 之 间 的 调剂 工时 ,使 总 利润 最 大 . 
6.2 ”咖啡 制造 三 用 3 种 咖啡 豆 制 造 一 种 混合 咖啡 每 种 咖啡 豆 的 香味 等 级 .味道 等 级 、 售 价 


及 库存 量 如 表 6. 19 所 示 . 
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6.4 


表 6.19 咖啡 豆 的 品质 、 售 价 及 库存 


咖啡 豆 香味 等 级 味道 等 级 售 价 /( 元 /千克 ) 库存 /千克 
L 霜 86 20 500 
区 85 88 28 600 
3 60 由 18 400 


假设 混合 咖啡 的 香味 等 级 和 味道 等 级 是 所 用 咖啡 豆 的 香味 等 级 和 味道 等 级 的 加 权 平 


均值 ,等 级 越 高 质量 越 好 . 现 要 生产 1000 千克 混合 咖啡 ,要 求 香味 等 级 不 低 于 75, 味 
道 等 级 不 低 于 80. 要 使 成 本 最 低 应 如 何 配 制 ? 试 建立 该 问题 的 数学 模型 . 
某 人 选择 4 种 基金 进行 组 合 投资 ,咨询 师 为 他 提供 了 如 表 6. 20 所 示 的 5 种 可 能 的 年 


收益 率 (%). 
表 6.20 基金 收益 
可 能 性 
基 金 
1 2 EE 4 5 
1 5. 06 8. 12 8.47 40. 23 一 船 :给 
2 12.45 3. 22 4.51 一 也 53 7.63 
3 32.18 14.16 33. 64 40. 25 一 18.09 
4 32. 02 20. 53 12. 92 7.14 一 5.85 


此 人 采用 保守 的 策略 ,要 求 可 能 的 最 低 收益 率 最 大 ,应 如 何 确定 这 4 种 基金 的 投资 比 


例 ? 试 建立 该 问题 的 数学 模型 . 
用 图 解法 解 下 列 线性 规划 
C1) max my ws 
st zi<5 
Za<3 
2 十 35x<1I 
X17T2 宇 0 


(2) min zl 一 Zz 


Ss, t, 


十 3zz<14 


一 区 十 Wi 入 3 


动 


4 


Xi’X2>0 
(3) niin 2%1 Xs 
Xi 十 Xs 宇 1 
za 和 2 


Tiyzz 过 0 


Ss, t. 


(4) min 2zx1— xz 
s.t。2zi 十 zz 过 2 


线性 规划 


一 2 了 
Zi1sT2>0 
(5 max 3mi— 2ws 
| 
331 iS9 
Xi 十 2x; 宇 9 
Ziyz2 之 0 
6.5 写 出 下 述 线性 规划 的 标准 形 
max 3zi 一 2zs 十 zs 
s.t. 2 十 2zs 一 zs 魏 1 
dz 一 ss 
2 一人 一 以 
Zl 一 37z2z? 十 2zs 一 一 10 
Xi 宇 0， zs 任意 ，zx3 宇 0 
6.6 设 线性 规划 
max 27l 十 zz 
5 一 六 二 22 入 1 
i 5 
Xi'Xs 宇 0 
(1) 画 出 它 的 可 行 域 ,用 图 解法 求 最 优 解 . 
(2) 写 出 它 的 标准 形 , 列 出 所 有 的 基 , 指 出 哪些 是 可 行 基 . 通过 列 出 所 有 的 可 行 解 及 
其 目标 函数 值 找到 最 优 解 . 指出 每 个 可 行 解 对 应 的 可 行 域 的 顶点 . 
6.7 设 线性 规划 标准 形 


max 5x1 — 2xs 


Bs 一 10 
A 十 2 一 3 
Xs 十 Xs 二 2 


wo Wl 雪 5 
下 列 4 个 z+ 都 满足 等 式 约束 , 问 其 中 哪些 是 可 行 解 ? 哪些 是 基本 解 ? 哪些 是 基本 可 行 解 ? 
a = 0) 

= (3,0,1,0,2) 

=A 

(0,0,10,3,2) 

6.8 ”用 图 解法 和 单纯 形 法 解 下 述 线性 规划 ,并 指出 每 张 单纯 形 表 中 的 基本 可 行 解 所 对 应 的 

可 行 域 的 顶点 . 


max zl 二 2x2 


Sb i 0k 


十 中 眉 
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Wh 
TI 十 Xs 夺 10 
Li — 1 SA 


XisTs 宇 0 
6.9 ”用 单纯 形 法 解 习题 6. 4 中 的 线性 规划 . 
6. 10 用 单纯 形 法 解 下 列 线性 规划 . 
(1 min 一 25i 半 2 一 
二 2 10 
一 4 一 2z 十 3z 关 10 
大 一 22x 十 Cs 过 14 
zj0， j=1,2,3 
(2) mili wt ws — 3 


Bt wws—2x<S9 


wi ams 2 
zs 4 
Zi>0， 7 一 1;2,3 
(3) max 3zi 十 5zs 十 47s 

st，2zi 十 3z5 十 ze?9 

一 zi 十 2zs 十 zs 一 12 
5 而 二 T2265 
zj>0，j=1,2,3 


(4) min 3z1 一 zz 一 27s 十 Z4 


Ss, t, 2z 十 37zz 一 Ts 一 三明 


wi— 2 3 — dn 8 
3ZX1 十 4zz 十 Za 一 6z4 一 4 
zj>0， 1<j<<4 
(5) min zl 一 2zz 十 32zs 

S.t. Zi 一 2zz 十 4zs 一 4 
421 一 9zz 十 14zs 一 16 
而 可 的 52 地 

6.11 设 线性 规划 


min ciTz 
AL = 62>>0. 
TX 宇 0 
的 基本 可 行 解 xz* 的 所 有 非 基 变量 的 检验 数 都 大 于 0,. 证 明 x* 是 唯一 的 最 优 解 . 
6.12 表 6.21 最 终 单 纯 形 表 ( 最 小 化 ) 给 出 一 个 最 优 的 基本 可 行 解 + 二 (3,2,0,4,0), 试 通 
过 基 变 换 找到 另 一 个 最 优 的 基本 可 行 解 .进而 给 出 无 穷 多 个 最 优 解 . 


6. 13 


6. 15 


6. 16 


G17 


线性 规划 


表 6.21 习题 6. 12 最 终 单纯 形 表 (最 小 化 ) 

= 一 0 0 0 

0 
CB TB b Tl 2 3 Ee Xs 
一 1 zl 3 1 0 1 0 一 1 
0 i 4 0 0 3 1 一 8 
一 1 zz 2 0 1 一 1 0 
一 = 5 0 0 0 0 1 


表 6. 22 是 一 张 最 终 单纯 形 表 (最 小 化 ) ,能 否 判断 它 是 否 有 无 穷 多 个 最 优 解 ? 若 能 ， 


请 给 出 你 的 结论 . 
表 6.22 习题 6. 13 最 终 单纯 形 表 (最 小 化 ) 
1 | 0 0 
0 
CB XB b rl Xs Ts Th 
-= Te 2 -= 时 和 0 
0 Ey 10 一 出 0 一 4 1 
= 吕 0 0 1 0 
写 出 下 列 线性 规划 的 对 偶 . 
mar Se — Zs 25 TA 
St w 十 za 一 2 一 2<6 
hy — 2 mh 之 5 
2zi 十 zz 一 3zs 十 24 一 一 和 
zs2zaod2s 宇 0， zw 任意 
写 出 习题 6.4(1) 和 (2) 中 线性 规划 的 对 偶 . 根据 互补 松弛 性 ,利用 原始 规划 的 最 优 解 


求 对 偶 规划 的 最 优 解 ,并 用 目标 函数 值 验证 它们 确实 都 是 最 优 解 . 

线性 拟 合 设 y= 二 azr 十 b, 现 有 一 组 x 和 yy 的 实验 数据 (x;,y;) ,1 二 in, 要 确定 a,b 使 
得 |azi 十 6 一 yi| (1 三 i 过 n) 的 最 大 值 最 小 . 

(1) 写 出 这 个 问题 的 线性 规划 模型 (P). 

(2) 写 出 (P) 的 对 偶 (D). 

(3) 比较 用 单纯 形 法 解 (P) 和 (D) ,说 明 为 什么 应 该 采用 (D). 

用 对 偶 单 纯 形 法 解 下 列 线性 规划 . 


(1) min zi 十 2zs 十 3zs 
st 2 一 2 十 3z5 志 6 
wi 2 之 4 


X13» T2730 


(2) min 3zi 十 zz 十 


Xs 


圳 吕 眉 
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st wiz 二 zs 8 
Br— 二 4 
2 一 ES 
ivzzvzs 过 0 
6.18 在 算法 6. 2 对 偶 单纯 形 法 中 ,为 什么 只 有 得 到 最 优 解 和 无 可 行 解 两 种 情况 ,而 没有 目 
标 函 数值 无 界 ( 无 最 优 和解) 的 情况 ? 
6.19 要 用 7m 长 的 钢管 截 成 3m、2. lm 和 1. 5m 的 管材 各 100 根 , 如 何 截取 才能 使 得 所 用 
的 钢管 数 最 少 ? 试 建立 该 问题 的 数学 模型 . 
6.20 某 厂 用 3 种 原料 生产 3 种 产品 ,原料 的 消耗 \ 利 润 , 每 周 的 最 高 产量 和 原料 的 最 大 供 
应 量 如 表 6. 23 所 示 。 
表 6.23 习题 6. 20 产品 与 原料 的 有 关 数 据 


2 原料 消耗 /( 吨 / 吨 ) 利 润 。 | 最 高 产量 
0 Ww I T 上 /( 万 元 / 吨 ) / 吨 
1 0.6 0.3 0.1 6 60 
2 0.4 0.3 0.3 4 30 
3 0.3 0 O07 5 80 
供应 量 / 吨 30 12 25 


除 此 之 外 ,还 有 固定 成 本 . 固定 成 本 只 与 是 否 生产 该 产品 有 关 , 而 与 生产 量 无 关 . 只 
要 生产 该 产品 ,启动 相关 设备 ,就 有 固定 成 本 . 3 种 产品 的 固定 成 本 分 别 为 30 万 、50 
万 和 20 万 .如何 安排 生产 才能 使 利润 最 大 ? 试 建立 该 问题 的 数学 模型 . 
6.21 用 分 支 限界 法 解 下 述 整数 线性 规划 ILP( 用 图 解法 解 有 关 的 线性 规划 ) 
max 3 并 十 y 
Bt 5 一 2 有 和 :5 
一 各 二 25 半 6 
3x+5y 26 
Xsy 宇 0， 整数 
6.22 ”用 单纯 形 法 或 对 偶 单纯 形 法 解 习题 6.21 中 ILP 的 松弛 和 它 的 两 个 子 问 题 . 


第 章 
网 络 流 算法 


本 章 介 绍 最 大 流 、 最 小 费用 流 、 运 输 问题 .二 部 图 匹配 和 指派 问题 的 算法 . 在 20 世纪 
50 一 60 年 代 , 随 着 计算 机 科学 技术 的 发 展 ,这 几 个 问题 得 到 非常 广泛 的 应 用 ,很 多 著名 学 者 
深入 地 研究 了 它们 的 算法 . 


7.1 最 大 流 问题 


7.1.1 网 络 流 及 其 性 质 


考虑 从 A 地 到 B 地 的 公路 网 络 , 中 间 有 若干 收费 站 和 盆 道 口 ,每 一 段 路 都 有 限定 的 流 
量 ( 辆 /天 ) ,实际 的 流量 在 每 一 段 路 上 都 不 能 超过 它 的 限定 . 除了 A、B 两 地 外 ,每 一 个 中 间 
点 (收费 站 和 岔 道口 ?都 不 允许 滞留 ,也 不 会 有 新 的 车 辆 加 入 ,从 而 流入 的 流量 等 于 流出 的 流 
量 . 这 就 是 一 个 典型 的 网 络 流 . 与 此 类 似 的 还 有 电网 中 的 电流 、 供 水 系统 中 的 水 流 以 及 金 
融 系 统 中 的 现金 流 等 ,下面 给 出 有 关 的 定义 . 

定义 7.1 设 有 向 连通 图 N=<V,E 二 , 记 n==|V|,m 二 |E|., 每 一 条 边 过 i,j 二 有 一 个 
非 负 实 数 c(Gi.7) , 称 作 边 二 i,j 二 的 容量 . N 有 两 个 特殊 的 顶点 和 ts 称 作 发 点 或 源 ,t 称 
作 收 点 或 汇 ,其余 的 顶点 称 作 中 间 点 . 称 N 为 容量 网 络 , 记 作 N= 二 <<V.E,c,s,t>. 

设 f: ER ,其 中 R"* 是 非 负 实 数 集 , 满 足下 述 条 件 : 

(1) 容量 限制 v<i,j 这 EE,f(i, 站 入 c(i, 站 ). 

(2) 平衡 条 件 vie 一 {st 2 GD 一 2 fG7. 


<ii>EE <ij>E€E 
称 了 是 N 上 的 一 个 可 行 流 . 称 发 点 ;的 净 流 出 量 为 了 的 流量 , 记 作 w(/), 即 
v= > 一 2 f0,8) 二 
< >EE <j,>EE 


流量 最 大 的 可 行 流 称 作 最 大 流 . 
直觉 上 ,由 于 中 间 点 满足 平衡 条 件 , 发 点 的 净 流 出 量 应 该 等 于 收 点 的 净 流 人 量 , 从 而 f 
的 流量 也 等 于 收 点 的 净 流 入 量 . 即 
= 2 FGD= DD fl) 
<int>E€EE < >EE 
把 它 留 作 习题 (见习 题 7. 1). 实际 上 ,总 可 以 假设 发 点 的 入 度 为 0, 收 点 的 出 度 为 0. 也 就 是 
说 ,流出 发 点 的 流 不 会 流 回 发 点 ,流入 收 点 的 流 也 不 再 流出 收 点 (见习 题 7. 16). 
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最 大 流 问 题 求 给 定 容量 网 络 上 的 最 大 流 . 

今后 总 可 以 假设 N 中 每 一 对 顶点 之 间 至 多 有 一 条 边 . 如 果 i 和 j 之 间 有 两 条 边 
二 i,j 这 和 j,i 这 ,可 以 在 <j,i> 上 插入 一 个 顶点 有 ,把 二 j,i 汪 分 成 两 条 边 二 j,k 二 和 
二 k,i 汪 , 且 容 量 都 等 于 c(j ,站 . 


最 大 流 问题 可 以 表述 成 线性 规划 : 
max vu(f) 
st fisj) Seli,j), i 
E pd f= iEV—{s,t} 
<j"i>€EE <ij>EE 7 2) 
ap 一 >) f+ > ff,5)=0 
一 > EPE <ji's>€EE 
pe 二 着 到: 
v(f) 宇 0 


由 于 最 大 流 问 题 的 重要 性 ,研究 人 员 并 不 满足 于 用 线性 规划 算法 求解 ,而 是 开发 了 多 个 
更 有 效 的 算法 ,其 中 有 些 算法 本 质 上 就 是 线性 规划 算法 的 应 用 . 在 介绍 算法 之 前 , 先 给 出 最 
大 流 的 一 些 性 质 . 
定义 7.2 设 容量 网 络 N=<V,E,c,s,t 宝 ,A 且 s eA,t eh , 称 
(A,A) = {<isj> | <ij> EHieA,i A} 
为 N 的 割 集 , c(A,A) = 》) c(i,j) 为 割 集 (A,A) 的 容量 . 


<ij>E(AD 
容量 最 小 的 割 集 称 作 最 小 割 集 . 
直觉 上 ,N 上 的 任何 可 行 流 都 要 通过 制 集 (A,A) 中 的 边 从 A 流 到 A ,从 而 任何 可 行 流 
的 流量 不 可 能 超过 制 集 的 容量 . 
引 理 7.1 设 容量 网 络 N= 二 <V,E,c,s,t 二 ,了 是 N 上 的 任 一 可 行 流 ,A CV 且 s eA， 
t eA , 则 


oa) 一 > fi 2 GD (RR 
一 ij>E(A,A) <ji>E(AA) 
证 v= Go) 一 BD f0,5) 
<sj>EE <j,>€EE 
= > /f(s.)— 之 GD 二 一 2 /0 DD)} 
<sj>EE i€A-{s} <i,j>E€E 
(平生 条件) 


= Bl 2 FY =— 型 /GD} 


i€EA <ij>EE 


= BD FD= DD DY Fn 


iEA<ij>EE i€EA<j EE 
= 交 寺 划 2 汰 起 订 
3 Sa eS 
> D1 Fehs 5 也 2 FG 
a EE 二 i>EE 
三 3 fi,7) — 5 J 
<ij>E(AA) ji>E(A,A) 


于 是 ,容易 得 出 下 述 结论 . 
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引 理 7.2 设 容量 网 络 N= 二 过 V,E,c,s,t 放 ,f 是 N 上 的 任 一 可 行 流 ,(A,A) 是 任 一 割 
集 , 则 
v(f) < eA,A) 
引 理 7.3 设 容量 网 络 N= 二 <<V,E,c,s,t 这 ,ff 是 N 上 的 一 个 可 行 流 ,(A,A) 是 一 个 制 
集 . 如 果 vCP)= c(A,A), 则 /是 最 大 流 ,(A,A) 是 最 小 割 集 . 


7.1.2 Ford-Fulkerson 算法 


1962 年 L. R. Ford 和 D. R. Fulkerson 把 原始 -对 偶 算 法 应 用 于 最 大 流 问题 ,提出 最 大 
流 问 题 的 标号 算法 ,简称 为 FF 算法 . 下 面 先 引入 相关 概念 . 

定义 7.3 设 容量 网 络 N= 二 <V,E,c,s,1,f 是 N 上 的 一 个 可 行 流 .N 中 流量 等 于 容 
量 的 边 称 作 饱 和 边 ,流量 小 于 容量 的 边 称 作 非 饱和 边 . 流量 等 于 0 的 边 称 作 零 流 边 ,流量 大 
于 0 的 边 称 作 非 零 流 边 . 

不 考虑 边 的 方向 ,N 中 从 顶点 i 到 j 的 一 条 边 不 重复 的 路 径 称 作 i-i 链 . i-j 链 的 方向 
是 从 i 到 j. 链 中 与 链 的 方向 一 致 的 边 称 作 前 向 边 ,与 链 的 方向 相反 的 边 称 作 后 向 边 ， 如 果 
链 中 所 有 前 向 边 都 是 非 饱 和 的 ,所 有 后 向 边 都 是 非 零 流 的 , 则 称 这 条 链 为 ;7 增 广 链 . 

设 P 是 一 条 关于 可 行 流 / 的 s-t 增 广 链 , 令 6 等 于 P 上 所 有 前 向 边 的 容量 与 流量 之 差 
以 及 所 有 后 向 边 的 流量 的 最 小 值 . 根据 增 广 链 的 定义 ,6 二 0. 如 下 修改 / 的 值 , 令 

f(i, 站 十 5， 二 i,j 之 是 PP 的 前 向 边 
(ij) = 1f(i,j) 一 6， 二 i,j 之 是 PP 的 后 向 边 (gD) 
fi js 否则 

如 图 7. 1 所 示 . 不 难 证 明 ,/ “是 非 负 的 且 满 足 容量 限制 和 平衡 条 件 , 从 而 是 可 行 流 , 且 
af) 一 uC 十 8. 因此 ,如 果 /是 最 大 流 , 则 不 存在 关于 / 45 +5 5 415 
的 s-t 增 广 链 . 实际 上 , 反 过 来 也 成 立 . 

定理 7.1 可 行 流 / 是 最 大 流 的 充分 必要 条 件 是 不 存 
在 关于 了 的 s-t 增 广 链 . 

证 必要 性 刚才 已 经 证 明 . 现 证 明 充 分 性 ,假设 不 存在 关于 f 的 -i 增 广 链 . 令 

A=={jeV | 存在 关于 了 的 -i 增 广 链 } 


s eA ,由 假设 ,t gA. 

V<i,je(A,A), 必 有 f(i, 站 ==c(i,j). 否则 ,假设 二 i,j 二 是 非 饱 和 的 . 由 于 i eA , 存 
在 关于 /的 s-i 增 广 链 P. 而 二 i.j 一 是 非 饱 和 的 ,P 可 以 延伸 到 j, 与 j 4gA 矛盾. V<j,i>e 
(A,A), 必 有 GD 一 0. 否则 ,假设 二 j,i 一 是 非 零 流 的 , 由 于 i eA ,存在 关于 /的 s-i 增 广 
链 P. 而 二 j,i 瑟 是 非 零 流 的 ,P 可 以 通过 后 向 边 二 j,i 六 延伸 到 j, 与 7 gA 矛盾 . 

于 是 ,根据 引 理 7. 1， 


oD= 2 END= DD fd= DY d= A A 
<ij>E(AA) < 一 ji 一 E(A,A) 一 ij 一 E(4A,A) 
又 由 引 理 7. 3, 得 证 f 是 最 大 流 . 
上 述 证 明 还 同时 证 明了 (A ,A) 是 最 小 制 集 , 从 而 证 明了 下 述 定理 . 
定理 7.2( 最 大 流 最 小 割 集 定理 ) ”容量 网 络 的 最 大 流 的 流量 等 于 最 小 制 集 的 容量 . 
FF 算法 的 基本 步骤 如 下 : 从 给 定 的 初始 可 行 流 (通常 取 零 流 . 即 所 有 边 上 的 流量 为 0) 
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的 可 行 流 , 重复 这 个 过 程 ,直到 不 存在 st 增 广 链 为 止 . 


开始 ,寻找 一 条 关于 当前 可 行 流 的 st 增 广 链 己 ,按照 式 (7. 4) 修 改 链 上 的 流量 ,得 到 一 个 新 


寻找 st 增 广 链 的 方法 是 ,从 发 点 s 开始 搜索 ,逐个 给 顶点 作 标 号 ,直到 收 点 上 得 到 标号 为 
止 . 顶点 7 得 到 标号 表示 已 找到 从 * 到 7 的 增 广 链 , 标 号 为 (4 ,6;), 其 中 65 等 于 直到 j 为 止 链 上 


所 有 前 向 边 的 容量 与 流量 之 差 以 及 所 有 后 向 边 的 流量 的 最 小 值 ,/ 二 十 i 或 4 二 一 i. 4 二 十 i 表 


示 链 是 从 i 到 j 且 过 i,j 是 前 向 边 ,4 二 一 i 表示 链 是 从 i 到 j 且 过 j,i 这 是 后 向 边 . 


顶点 分 为 3 类 : 已 标号 已 检查 的 ,已 标号 未 检查 的 ,未 标号 的 . 开始 时 ,给 ;标号 (A, 十 史 ， 
人 A 表示 s 是 发 点 ,s 是 已 标号 未 检查 的 ,其 余 顶 点 都 是 未 标号 的 . 每 一 步 , 取 一 个 已 标号 未 检 


查 的 顶点 记 对 所 有 的 顶点 六 若 二 ;人 > 拒 且 (i, 丫 达 c(i, 站 , 则 给 j 标 号 (十 i,6;), 其 中 


上 


6 一 min{0cG 四 一 FGJ)); 若 <j >eE 且 Fi 二 0, 则 给 7 标号 (一 交 ,0 ) ,其 中 沪 一 


min{6;,f(7 ,7))}. 


算法 7.1 Ford-Fulkerson 算法 . 


1. /60 // 取 零 流 作为 初始 可 行 流 

2. TeAs} ,Re<V 一 fs) ,leh d+ // 工 是 已 标号 未 检查 的 顶点 集 ,R 是 未 标号 的 顶点 集 
3. while T x2do 

4. 取 ieT,T¢T 一 {0 // 检 查 项 点 i 

5. for 所 有 RR 中 与 i 邻接 的 j do 

6. if <i,j>eE /Ci,))<e(i,j) then 

到 betid emin{ ci) — fi)D)} ,ReR—{j}, TeTU()} 

8. if j=t then goto 13 // 已 找到 一 条 s-t 增 广 链 

9. if <j,i>eE /OG,D)>0 then 

广 ， Lei emin{(6, 0D}) ,ReR—{)},T TU{)) 

i if j=t then goto 13 // 已 找到 一 条 s-t 增 广 链 

12. reture / // 不 存在 s-t 增 广 链 ,计算 结束 

13. 6¢6, // 从 上 开始 回溯 ,修改 增 广 链 上 的 流量 
14. if 4;=Athen goto 2 // 修 改 完毕 ,重新 开始 下 一 阶段 标号 


15. if 4=++i then 
16. fIDEfGD +O ei 
17. if =—i then 

18. /OD D0 0 
19. goto 14 


例 7.1 对 图 7.2 中 的 容量 网 络 应 用 FF 算法 ,图 中 边 旁 的 数 是 容量 . 


解 用 FF 算法 的 计算 过 程 如 图 7. 3 所 示 . 边 旁 标 有 两 个 数 ,第 一 个 是 容量 ,第 二 个 是 


vf =18: 


当前 的 流量 . 顶点 旁 的 括号 是 它 的 标号 ,每 个 图 
的 左边 给 出 检查 顶点 的 顺序 ,括号 内 是 检查 这 个 
顶点 时 得 到 标号 的 顶点 , 粗 边 是 找到 的 st 增 广 
链 . 输出 的 可 行 流 f 如 图 7. 3(f) 所 示 , 流 量 


当 FF 算法 检查 完 所 有 已 标号 的 顶点 时 , 若 
t 没有 标号 . 则 计算 终止 . 记 A 为 所 有 已 标号 的 
顶点 集 , 必 有 s eA .1 eA. i eA 当 且 仅 当 存 在 关 
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图 7.3 


于 了 的 s-i 增 广 链 .由 于 1 ggA ,不 存在 关于 了 的 s-t 增 广 链 . 根据 定理 7.1,f 是 最 大 流 , 同 
时 (A,A) 是 最 小 割 集 (A.A) 中 的 每 一 条 边 二 i,j 二 都 是 饱和 边 ,(A,A) 中 的 每 一 条 边 
二 j,i 这 都 是 零 流 边 . 

在 图 7. 3(f) 中 ,虚线 画 出 了 最 小 割 集 (A,A), 这 里 A={s,2,3},A=={1,4,1t},(A,A)== 
{=s,1 二 ,<2,1 二 ,=3,t} 中 都 是 饱和 边 ,(A,A)=={ 二 1,3 二 ,二 4,3 二 } 中 都 是 零 流 边 . 

上 述 分 析 表 明 ,FF 算法 也 可 以 用 来 求 最 小 割 集 . 

下 面 分 析 FF 算法 的 运行 时 间 和 有 限 终止 性 . 假设 所 有 的 容量 都 是 正 整数 ,计算 中 每 次 
的 修改 量 $ 也 是 正 整数 . 记 C = >) cs, 站 ), 显然 最 大 流量 v* 三 C. 由 于 6 是 正 整 数 ,每 


<sj>EE 
个 阶段 流量 至 少 增加 1, 至 多 有 C 个 阶段 . 而 每 个 阶段 标号 和 修改 增 广 链 上 的 流量 可 在 
OGm) 步 内 完成 , 故 算法 的 时 间 复 杂 度 为 OCmzC). 
用 计算 机 计算 , 数 的 表示 都 有 一 定 的 精度 . 以 其 精度 为 单位 ,每 个 数 都 可 看 作 整 数 . 因 
此 ,上 面 的 分 析 仍 然 有 效 , 算 法 总 会 在 有 限 步 内 终止. 
但 是 在 理论 上 , 当 容 量 为 无 理 数 时 ,9 可 能 越 来 越 来 小 ,趋向 于 0. 实际 上 ,已 给 出 这 样 
的 例子 ,算法 不 能 在 有 限 步 内 终止 . 
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7.1.3 Dinic 有 效 算法 


FF 算法 没有 给 出 标号 过 程 的 细节 ,这 就 留 下 了 改进 的 空间 ，Dinic 算法 对 此 进行 了 两 
点 改进 : 其 一 是 每 次 求 最 短 的 ( 边 数 最 少 的 )s-: 增 广 链 :其 二 是 充分 利用 一 次 标号 提供 的 信 
息 ,修改 尽 可 能 多 条 s-t 增 广 链 上 的 流量 . FF 算法 每 次 标号 只 找 一 条 s-t 增 广 链 , 然 后 重新 
标号 . 实际 上 这 是 一 种 浪费 ,因为 新 标号 找到 的 s-t 增 广 链 很 可 能 在 前 面 的 标号 中 就 已 经 
存在 . 

定义 7.4 设 容量 网 络 N=<V,E,c,s' 上 二 ,是 N 上 的 可 行 流 . 定义 关于 /的 辅助 网 
络 N(f)=<V,E(f),ac,s,t 生 如 下 : 

E+(f) = {<i | <ii> Ea) ei) 
-ey = | < 
UY 
i eID <ij>Ee 2 we 
Ds <i,j>E€EE-(f) 
ac 称 作 辅助 容量 .N(/) 也 是 容量 网 络 . 

由 于 约定 N 中 任意 两 点 之 间 至 多 有 一 条 边 , 因 而 N(/) 中 不 会 出 现 平 行 边 . 不 难看 出 ， 
N 中 关于 了 的 s-i 增 广 链 就 是 NCAP 中 从 到 :上 的 有 向 路 径 . 

引 理 7.4 设 N 的 最 大 流量 为 w” ,f 是 可 行 流 , 则 N(/) 的 最 大 流量 为 v* 一 zw 六， 

证 设 Ad 且 s eA,t eA. 在 NN 中 (A,A) 是 一 个 割 集 , 仍 记 作 (A,A). 在 N(/) 中 
(A,A) 也 是 一 个 市 集 ,把 它 记 作 (A,A)'. (A,A)’ 由 (A,A) 中 关于 /的 非 饱和 边 El 和 
(4A,4A) 中 关于 /的 非 零 流 的 反 向 边 下 :两 部 分 组 成 . 于 是 ,(A,A) 的 容量 

病人 


<ij> EE <hj>€EE, 

= 2 {DD 一 JE DH FD 

<ij>E(AN) <j i>E(A,A) 

= DD i 
<ij>E(AA) <ij>E(AD <j'i>EAA) 

= c(A,.A)—v(f) ( 引 理 7.1) 


由 此 得 证 ,N(/) 中 最 小 割 集 的 容量 等 于 N 中 最 小 割 集 的 容量 减 w(./). 根据 最 大 流 最 小 割 
集 定 理 ( 定 理 7. 2) ,得 证 N(/) 的 最 大 流量 等 于 v* 一 v(/). 
定义 7.5 设 / 是 N 上 的 一 个 可 行 流 ,g 是 N(f) 上 的 一 个 可 行 流 ,定义 /=f 十 g 
如 下 : 
VY<i,j> eE, f0)) = fi +e) — gi) (7.6) 
这 里 规定 , 当 <ij 盖 呀 (C 门 时 ,gGJ) 一 0. 
引 理 7.5 设 了 是 N 上 的 一 个 可 行 流 ,g 是 NCAP 上 的 一 个 可 行 流 , 则 f 二 g 是 N 上 的 
可 行 流 , 且 v(f 十 g)==v(/) 十 v(g). 
证 容量 限制 
Voi eBE; 0Xg( NDC) — fj Og FE), 
— fi) Sg) — gs) ei — fi)) 


推出 
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OZ FON = fH Fa — gO ee, 
平衡 条 件 Vi EE 一 {s,t})， 


DB) FGD= >) {fOD+gG,D) — gi,))} 
<j'i>EE < 一 ji 和 已 
= >) fFOD+ > gO0D 一 2 go)) 


一 ji>EE <jri>EEN <ij>€EEN 


MA<j ,iEE A<j,i>EE 
YB FB= DB (Gy 


<ij>€EE <ij>€eE 


Hg(i,7) — g(j,7)} 


= 2 Ft 2 gD)— 2 gQd) 
<ij>E€EE <ij>EEN <j/i>E€EEN 
A<ij>€EE A<ij>€EE 


2 FGD— 2 FGOD= 2 FGD— 2 FOND+ 2 gd) 


<ii>€EE 一 ij>EE <ji>EE <ij>€EE <ii>EEN 
MA<j'i>E€EE 
一 DD) go 2) g++ 2 go 
<ij>EEN <ij>EEN <ii>EEN 
A<j'i>EE A<ij>€EE A<ij>EE 
=( 2) fGD— 2 G7)) 
<j'i>€EE <ihj>EE 
+{ 2 sD— 2 AD)=0 
<i/i>EEN <ij>EEN 


得 证 六 =f 十 g 是 N 上 的 可 行 流 . 


万 的 流量 
uC) 一 加 {f(ss7) + stssd) — es} 一 > {f(j»5)+ gj ss) — gs,7)} 
<sj>E€EE <js>E€EE 
= > fFGD+ 2D) gs))— DD) gO,s) 
< ji>EE < >EEN <j's>EEN 
A<si>EE A<si>EE 
一 DfGD— 2 gd+ 2) gc 
<j,>EE <j's>€EEN < ji>EEN 
A<i's>€EE A<ji's>€EE 
= fn 2 FOE 一 DE el) 
< jj>EE <j,s>E€EE <sj>EEN <j's>EEN 


=v() +v(g) 
从 开始 ,采用 广度 优先 搜索 N(f). 按 与 :的 距离 把 顶点 划分 成 不 相交 的 层 ， 用 
d( 让 表示 s 到 i 的 距离 . d(s) 二 0,1s) 是 0 层 . 记 d=d(D). N( 有 中 从 s 到 1 的 最 短路 径 只 
可 能 从 ;到 1 层 , 再 到 2 层 ,……, 直 到 +1 为止. 最 短路 径 上 不 可 能 出 现 从 高 层 到 低层 的 边 
和 同一 层 顶 点 之 间 的 边 , 也 不 可 能 出 现 除 1 之 外 层 数 大 于 等 于 的 顶点 . 从 N(/) 中 删 去 所 有 
这 些 边 和 顶点 后 的 网 络 称 作 分 层 辅 助 网 络 , 记 作 AN(/) 二 二 V( 有 ,AE(f),ac,s,t 宇 ,其 中 


过 
We = Wy 
k=0 


qd-1l 


AE(D = {<ij>|I<ij>E EV NiE€E VN ETVeaCP) 


k=0 


Vi = {i |dQ)=k}, 0<k<d—1 


才 N 四 
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0 = 地 
例 7.2 容量 网 络 N= 二 二 V.,E,c,s,t 一 及 其 上 面 的 可 行 流 如 图 7.4(a) 所 示 . N( 有 1) 
和 AN 六 ) 如 图 7.4(b) 和 (c) 所 示 . 在 图 7.4(b) 中 顶点 旁 口内 的 数 是 该 顶点 的 层 数 . 在 


图 7.4(c) 中 与 + 同一 层 的 顶点 11 及 其 关联 的 边 已 被 删 去 . 


(©) AN(A) 
图 7.4 
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定义 7.6 设 了 是 容量 网 络 N 中 的 可 行 流 ,关于 了 的 不 含 后 向 边 的 增 广 链 称 作 前 向 增 
广 链 . 如 果 不 存在 关于 / 的 s-t 前 向 增 广 链 , 则 称 f 是 NN 中 的 极 大 流 . 

最 大 流 必 是 极 大 流 ,但 极 大 流 不 一 定 是 最 大 流 . 如 图 7. 5 中 的 可 行 流 是 极 大 流 , 但 不 是 
最 大 流 . 

Dinic 算法 的 关键 步骤 是 求 AN(/) 中 的 极 大 流 . 求 AN 
( 亡 中 的 极 大 流 就 是 在 AN(/) 中 找 尽 可 能 多 的 从 ; 到 + 的 最 
短路 径 并 给 出 这 些 路 径 上 的 流量 . 为 了 提高 效率 ,算法 不 是 一 
条 一 条 地 找 , 而 是 每 一 次 给 出 流量 尽 可 能 大 的 可 行 流 . 具体 做 
法 如 下 : 

对 每 一 个 顶点 i, 所 有 以 i 为 终点 的 边 的 容量 之 和 与 所 有 图 7.5 
以 i 为 始点 的 边 的 容量 之 和 中 小 者 称 作 顶 点 i 的 流通 量 , 记 作 
th(i)， 这 里 规定 以 发 点 * 为 终点 的 边 的 容量 和 以 收 点 1 为 始点 的 边 的 容量 为 十 wm th (让 是 
任何 可 行 流 能 够 通过 i 的 流量 的 上 限 . 在 图 7.4(0) 中 ,th(s)==9,1h(1)==3,th(2) 二 4,th(3) 
=4,th(9)=0,th(t)=6. 

删 去 流通 量 为 0 的 顶点 及 其 关联 的 边 ， 从 图 7. 4(c) 中 删 去 顶点 9 及 其 关联 的 边 
二 7,9 二 . 顶点 7 的 流通 量变 为 0, 也 要 删 去 ,同时 删 去 边 二 4,7 二 和 过 5.7 二 . 顶点 5 的 流通 
量 又 变 为 0, 继 续 删 去 顶点 5 和 边 二 2.5 二 . 在 剩 下 的 图 中 流通 量 最 小 的 顶点 是 1,6 和 8， 
th(1) 二 th(6) 二 th(8) 二 3 从 顶点 1 开始 ,要 送出 3 个 单位 的 流 ,1 个 单位 的 流 沿 二 1,3 二 到 
顶点 3,2 个 单位 的 流 沿 二 1,4 二 到 顶点 4. 顶点 3 得 到 1 个 单位 的 流 .为 了 满足 平衡 条 件 , 必 
须 把 1 个 单位 的 流 送 给 顶点 6. 先 不 处 理 顶 点 6, 而 是 逐 层 处 理 . 顶点 4 得 到 2 个 单位 的 流 ， 
要 送出 2 个 单位 的 流 . 它 有 2 条 边 离开 . 当 有 多 条 边 离 开 ( 进 入 ) 同 一 个 顶点 时 ,可 以 把 流 任 
意 地 安排 给 其 中 的 一 条 或 几 条 ,原则 是 得 到 流 的 边 要 么 成 为 饱和 边 ,要么 已 用 完了 流量 . 在 
这 里 ,可 以 把 2 个 单位 的 流 安 排 给 二 4.6 二 和 一 4.8 二 中 的 任何 一 条 ,但 不 能 给 二 4.6 二 安排 
1 个 单位 ,再 给 二 4,8 二 安排 1 个 单位 (如 果 是 3 个 单位 的 流 , 可 以 给 二 4,6 二 安排 2 个 单位 ， 
给 二 4,8 二 安排 1 个 单位 ). 这 里 把 2 个 单位 的 流 安 排 给 天 4,6 二 . 接 下 来 处 理 顶 点 6. 它 
从 顶点 3 和 顶点 4 共 得 到 3 个 单位 的 流 ,都 通过 所 6.10 之 送 到 顶点 10. 接着 处 理 顶点 10， 
通过 一 10,: 二 将 3 个 单位 的 流 送 到 +。 至 此 ,从 顶点 1 向 前 将 3 个 单位 的 流 送 到 收 点 1， 向 
后 的 过 程 与 此 类 似 . 这 里 只 需 从 发 点 将 3 个 单位 的 流通 过 一 s,1 二 送 到 顶点 1. 这 样 安排 
流 不 会 出 现 阻塞 现象 ( 通 不 过 某 个 项 点), 因 为 输送 的 流 的 流量 是 最 小 流通 量 , 不 会 超 
过 任何 顶点 的 流通 量 . 得 到 的 流 在 图 7.6(a) 中 给 出 .安排 完 流 后 , 删 去 流通 量 最 小 的 顶点 
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(e) NA 与 万 
图 7.6 ( 续 ) 
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(h) ANG;) 
图 7.6 ( 续 ) 


(此 时 它 的 流通 量 为 0) 及 其 关联 的 边 . 删 去 饱和 边 . 将 安排 了 流 的 边 的 容量 减 去 流量 ,得 到 
图 7.6(b). 重复 刚才 的 做 法 ,顶点 4 的 流通 量 太 (4) 二 2 最 小 ,新 得 到 的 流 如 图 7. 6(b) 中 所 示 . 
再 修改 网 络 得 到 图 7. 6(c). 在 图 7.6(c) 中 不 存在 从 :到 1 的 最 短路 径 . 至 此 得 到 ANCA ) 的 极 
大 流 si ,如 图 7. 6(d) 所 示 . 

令 有 二 有 十 gi1，f2 如 图 7.6(e) 中 所 示 . 至 此 这 一 阶段 完成 . 重复 上 述 过 程 , 见 图 7.6(f) 一 
(hb). 求 AN(fi) 的 极 大 流 g; .得 到 fs 二 fi 十 gs. AN(f;) 中 不 存在 从 s 到 + 的 路 径 , 计 算 结 束 . 
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算法 7.2 Dinic 算法 . 


YA // 取 零 流 作 为 初始 可 行 流 
构造 ANCP) 

if AN(/) 中 不 存在 从 s 到 1 的 路 径 then return f // 计 算 结束 

S 40 


if AN( 让 中 存在 th(2)==0 then 
if i=s vi=t then goto 15 
else 删 去 i 及 其 关联 的 边 
找到 流通 量 最 小 的 顶点 &, 从 k 开 始 将 th(k) 个 单位 的 流向 前 送 到 1, 向 后 推 到 ;, 并 将 它们 加 到 g 上 
//th(k)>0 


和 


9 删 去 & 及 其 关联 的 边 

10. for <i,j> eAE(f) do 

11. ifg(i,)= ac(i,j) then 

2 删 去 二 i,j 二 

13. else ac(is))¢ac(i)—g(i,)) 

14. goto 5 

15. F 4 十 & 

16. goto 2 

引 理 7.6 在 每 个 阶段 结束 时 ,g 是 AN 中 的 极 大 流 . 

证 算法 的 每 个 阶段 从 构造 当前 的 可 行 流 / 的 分 层 辅助 网 络 AN(/) 开 始 , 逐 步 安 排 流 
8g， 只 有 当 流 通 量变 成 0 后 , 才 删 去 这 个 顶点 及 其 关联 的 边 . 这 样 的 顶点 和 边 不 可 能 出 现在 
关于 g 的 s-t 前 向 增 广 链 上 ,， 当 每 个 阶段 结束 时 ,AN 剩余 的 图 中 已 不 存在 从 到 上 的 路 
径 , 从 而 得 到 的 g 是 AN 六 的 极 大 流 . 

引 理 7.7 在 每 个 阶段 ,AN(f 十 g) 中 s-t 距离 大 于 前 一 个 阶段 AN(/) 中 s-t 距离， 这 
里 约定 , 当 不 存在 s-t 最 短路 径 时 ,认为 其 距离 为 十 

证 先 考察 N(f 十 g) 中 和 AN(f) 中 的 边 . 记 f= 二 f 十 g. VY<i,j 记 eAE(/), 若 
<isj>eE, 则 acGi,))= eG — fDi =f +ge(i,)), Bg(i,j) <ac(i,j) 
时 ,了 (i, 门 =c(iy 站 一 ac(iy 门 十 gbiy 门 过 c(i, 站 ,从 而 i,j 这 EeE(f 十 g). 当 g(i,))==ac(i,j) 时 ， 
f=c(isj) 一 ac(iy 站 十 g(is 站 =cbisy 站 ;从 而 过 i,j 写 (f 十 g)， 此 外 ; 当 f(i,j)= 
0 且 g(i, 站 >0 时 ,N(f 十 g) 比 N(/) 多 一 条 边 <j,i>. 车 <<j ,i>eE, 则 ac(i, 站 =f(j,)， 
fF (GD=f0 DD—gCi)). gisj) <acis))NH, ff Gs)=ac(i,j)—g(i,j)>0,<isj>e 
E(f+g). 当 g(i,j)=ac(iy)) 时 ,f(D)=ac(i,) 一 g(i,j) 二 0, 达 i,jqE(f 十 g). 此 外 ， 
当 fj 站 ==c(j ;让 且 了 G5 让 之 cj ;四 时 ,NC(f 十 g) 也 比 N(/) 多 一 条 边 二 j,i 放 . 综 上 所 述 ， 
AN( 几 ) 中 的 边 也 是 N(f 十 g) 中 的 边 当 且 仅 当 它 是 关于 g 的 非 饱 和 边 . 此 外 ,由 于 g 产生 的 
在 N(f 十 g) 中 而 不 在 AN() 中 的 新 边 都 是 从 AN(/) 的 高 层 指向 低层 . 

其 余 在 N() 中 而 不 在 AN(f) 中 的 边 都 与 g 无 关 , 因 而 仍 在 N(f 十 g) 中 . 这 种 边 不 
可 能 从 AN( 了 /) 中 的 低层 指向 高 层 ,只 可 能 从 高 层 指向 低层 在 同一 层 或 者 与 不 在 AN(/) 中 
的 顶点 关联 . 

总 之 ,在 N(f 十 g) 中 而 不 在 AN() 中 的 边 都 不 可 能 从 AN( 让 中 的 低层 指向 高 层 . 

AN(f 十 g) 中 从 s 到 t 的 最 短路 径 也 就 是 N(f 十 g) 中 从 s 到 t 的 最 短路 径 . 如 果 它 的 边 
都 是 AN( 户 中 的 边 ,那么 这 些 边 都 是 关于 g 的 非 饱和 边 , 从 而 这 是 一 条 AN(/) 中 关于 g 的 
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s-t 前 向 增 广 链 . 这 与 g 是 AN( 放 中 的 极 大 流 矛 盾 , 故 AN(f 十 g) 中 从 s 到 + 的 最 短路 径 
中 一 定 含 有 不 在 AN(/) 中 的 边 ,而 这 些 边 都 不 可 能 从 AN(/) 的 低层 指向 高 层 ,所 以 
AN(f 十 g) 中 s-t 距离 必 大 于 AN(/) 中 s-t 距离 . 

定理 7.3 Dinic 算法 得 到 的 f 是 最 大 流 , 且 算 法 在 O(n ) 步 内 终止 . 

证 ” 当 算 法 终止 时 ,AN(7/) 中 不 存在 从 s 到 z 的 路 径 , 因 此 NCAP) 中 也 不 存在 从 > 到: 
的 路 径 , 它 的 最 大 流 为 零 流 ,最 大 流量 为 0. 根据 引 理 7.4,v* 一 v(/) 二 0, 其 中 wv 是 最 大 流 
量 . 推出 v(f)==v* ,得 证 f 是 最 大 流 . 

由 引 理 7.7,AN(/) 中 s-t 距离 每 个 阶段 至 少 增 加 1, 而 s-t 距离 不 会 超过 nn 一 1, 故 至 多 
有 个 阶段 . 

在 每 个 阶段 ,构造 AN(/) 可 在 O(m) 步 内 完成 ,计算 顶点 的 流通 量 需 Olm) 步 . 在 生成 
g 的 过 程 中 , 找 一 个 流通 量 最 小 的 顶点 需 O(n) 步 ,至 多 找 n 次 ,至 多 需 O(n?) 步 ,对 边 操作 
可 以 分 成 两 类 : 一 类 是 修改 容量 后 删 去 这 条 边 ( 已 是 饱和 边 ), 这 类 至 多 有 0O(m) 次 ; 另 一 类 
是 修改 容量 后 不 删 去 . 根据 安排 流量 的 规定 ,从 一 个 顶点 送出 流 时 ,被 修改 容量 的 边 中 至 多 
有 一 条 边 是 非 饱 和 边 被 保留 下 来 ,从 一 个 流通 量 最 小 的 顶点 安排 流 至 多 有 nn 条 这 样 的 边 ， 
至 多 进行 n 次 ,共有 OC) 次 这 类 操作 .因此 ,每 个 阶段 的 工作 量 为 OCGm) 十 OGm) 十 OG ) 十 
OGm) 十 OG )= 二 Om ). 得 证 总 的 工作 量 为 O02 ). 

有 一 些 组 合 问题 可 以 转化 成 最 大 流 问 题 ,其 中 某 些 问题 的 容量 网 络 具 有 某 种 特殊 的 结 
构 , 使 得 Dinic 算法 具有 更 好 的 性 能 . 在 7.4 节 用 Dinic 算法 解 二 部 图 的 最 大 匹配 问题 时 遇 
到 的 是 一 类 特别 简单 的 容量 网 络 , 边 的 容量 均 为 1, 所 有 的 中 间 点 或 者 入 度 为 1 或 者 出 度 为 
1, 称 这 样 的 容量 网 络 为 简单 容量 网 络 . 

引 理 7.8 在 简单 容量 网 络 N 中 ,s-: 距离 1 小 于 等 于 n/v" 十 1, 其 中 v* 是 NN 的 最 大 
流量 . 

证 把 与 :的 距离 为 i 的 顶点 集 记 作 Vi.i 二 1,2,…,/ 一 1. 任何 最 大 流 都 要 经 过 Vi, 而 
Vi 中 每 个 顶点 或 者 入 度 为 1 或 者 出 度 为 1, 其 流通 量 为 1, 因 此 v* 夺 |Vi|. 于 是 ,nn 宇 


1 
2 |Vi| 宇 (一 Dv ,得 证 1<n/v* 十 1. 
i=1 


定理 7.4 对 于 简单 容量 网 络 ,Dinic 算法 在 OG *m) 步 内 终止 计算 . 

证 由 于 容量 都 为 1, 计算 过 程 中 每 条 边 的 流量 为 0 或 1. 在 每 个 阶段 中 ,每 条 边 至 多 
修改 一 次 ,计算 量 为 OCm). 

要 证 阶段 数 为 0(0a4 ). 车 v* 三 mw , 则 显然 至 多 有 nn 个 阶段 . 若 v* 二 mm ,考察 流量 
第 一 次 超过 wv* 一 mn 的 阶段 . 设 这 个 阶段 开始 时 的 可 行 流 为 /, 那 么 N(/) 的 最 大 流量 大 于 
m2 不 难 验 证 ,N(/) 也 是 简单 容量 网 络 ( 见 习题 7.4). 根据 引 理 7.8,N(/) 中 s-t 距离 小 于 
等 于 n/m 十 1 二 mm 十 1, 从 而 在 这 个 阶段 之 前 至 多 有 mm“ 个 阶段 . 而 这 个 阶段 结束 时 流量 
已 超过 w* 一 mm ,从 而 此 后 也 至 多 有 mw“ 个 阶段 ,总 阶段 数 不 超 过 2 十 1. 

最 后 ,简单 介绍 无 向 容量 网 络 上 的 最 大 流 问题 . 设 无 向 容量 网 络 N 一 之 V,E,c,s,t>， 
把 每 一 条 无 向 边 (i,7) 看 作 两 条 方向 相反 的 有 向 边 <ij 福 和 <j,i>, 记 作 N’'=<V,E’,c'， 
syt 盖 ,其 中 


E’ = (iy Ss I | Gv) EE} 
EG EE 
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又 设 了 是 N’ 上 的 一 个 可 行 流 ,V(i,j) EE, 车 了 (i, 门 之 了 (j, 让 , 则 令 f(i, 站 = 了 (i, 站 一 
ffODfGD=0; 车 0G) fFGD; 则 令 ff,D=f GD 一 了 (i,7),f(i,j)==0. 不 
难看 出 ,f 也 是 N’ 上 的 可 行 流 ,v(f) 二 v(f), 且 V(i,j)eE,f(i,j) 二 0 或 f(j, 让 二 0. 于 是 ， 
可 以 把 看 作 N 上 的 可 行 流 , 即 V(i,j)eE,f(i, 站 二 | 了 (i,j)) 一 六 (j,i 让. 这 样 就 把 计算 无 
向 容量 网 络 的 最 大 流 归 结 为 计算 有 向 容量 网 络 的 最 大 流 . 


7.2 最 小 费用 流 


对 于 可 行 流 ,有 时 还 要 考虑 费用 ,为 此 引入 下 述 概念 . 

定义 7.7 在 容量 网 络 N= 二 二 V,E,c,s,t 记 中 添加 单位 费用 w:E -六 , 称 作 容 量 -费用 
网 络 , 记 作 N= 二 V,E,c,w,s,t>. 

设 /是 N 上 的 一 个 可 行 流 , 称 w(/) 二 、》)w(i, 门 f(i,j) 为 /的 费用 . 在 所 有 流量 


<ij>EeE 
为 uw 的 可 行 流 中 ,费用 最 小 的 称 作 流量 vo 的 最 小 费用 流 . 

最 小 费用 流 问 题 “给 定 容量 -费用 网 络 N 和 流量 w。, 求 流量 wo 的 最 小 费用 流 . 

下 面 先 介绍 求 带 负 权 的 最 短路 径 和 检测 负 回 路 的 算法 ,在 最 小 费用 流 算法 中 将 要 调用 
这 个 算法 . 


7.2.1 Floyd 算法 


4.4.3 节 介 绍 的 求 最 短路 径 的 Dijkstra 算法 要 求 所 有 的 权 非 负 ， 当 带 有 负 权 时 ， 
Dijkstra 算法 不 再 适用 . 本 节 介 绍 带 负 权 的 最 短路 径 算法 . 

设 赋 权 有 向 图 D 二 二 V,E.w 记 ,其 中 权 函 数 w:E -R. 称 D 中 权 为 负数 的 回路 为 负 
回路 . 

命题 7.1 赋 权 有 向 图 D 中 任意 两 点 之 间 都 有 最 短路 径 或 不 存在 路 径 当 且 仅 当 中 
不 含 负 回 路 . 

证 假设 DD 中 存在 负 回 路 C ,i 是 C 上 的 一 个 顶点 ,那么 从 到 任何 一 个 顶点 7 的 路 径 
可 以 先 重复 走 C 若干 次 再 到 7. 随 着 重复 C 的 次 数 增加 ,从 i 到 j 的 路 径 的 权 越 来 越 小 , 趋 
向 于 一 w, 因 而 不 存在 从 i 到 j 的 最 短路 径 . 

反之 ,假设 D 中 不 存在 负 回 路 C. 对 任意 两 点 i 和 j ,如 果 从 i 到 j 的 路 径 中 有 两 个 相同 
的 顶点 ,那么 删 去 这 两 个 顶点 之 间 的 这 段 路 径 ( 这 是 一 个 回路 ) 后 仍 是 从 i 到 j 的 路 径 , 其 权 
不 会 增加 ,因而 只 需 考虑 从 i 到 j 顶点 都 不 相同 的 路 径 . 而 从 i 到) 顶点 都 不 相同 的 路 径 只 
有 有 限 条 , 故 一 定 存在 最 短路 径 . 

R. W. Floyd 于 1962 年 提出 一 个 算法 , 当 不 存在 负 回 路 时 , 求 得 所 有 两 点 之 间 的 最 短路 
径 ; 当 存 在 负 回 路 时 ,能 检测 出 并 给 出 一 条 负 回 路 . 

算法 采用 动态 规划 方法 . 假设 D 中 不 存在 负 回路 ,只 需 考虑 顶点 不 重复 的 路 径 . 记 从 i 
到 j 经 过 号 码 不 大 于 A 的 最 短路 径 的 长 度 为 do (ij). 从 i 到 j 经 过 号 码 不 大 于 k 的 最 短 
路 径 有 两 种 可 能 : 一 种 是 不 经 过 上 , 它 也 是 从 i 到 j 经 过 号 码 不 大 于 k 一 1 的 最 短路 径 ; 另 一 
种 是 经 过 上 , 它 被 & 分 成 两 段 , 从 i 到 k 经 过 号 码 不 大 于 k 一 1 的 最 短路 径 和 从 k 到 j 经 过 号 
码 不 大 于 k 一 1 的 最 短路 径 . 从 而 有 下 述 递 推 方程 : 


网 络 流 算法 


d® (i,j) = wli,j), je 
UM = a PGR Es 
lng 和 县 Wi 了 

这 里 规定 : Vi eV ,w(i,i)==0; V<i,j>gE,w(i,j)= 二 a 
当 D 中 不 存在 负 回 路 时 ,i 到 j 的 距离 d(i.7) 二 d'”(i,j). 当 DD 中 存在 负 回 路 时 , 设 负 
回路 C 经 过 i, 除 i 外 顶点 的 最 大 号 码 是 k, 则 必 有 d'*(i,i) 二 0. 
为 了 记录 最 短路 径 上 的 顶点 ,引入 h(i, 站 存放 从 i 到 j 经 过 号 码 不 大 于 k 的 最 短路 
径 中 i 的 下 一 个 顶点 . 有 下 述 递 推 关 系 : 
ys 其 EEB 
0， 否则 
hs Bs (7. 8) 
RADE 否则 ， 

1 二 TEEN 


击 入 器 


ic 一 | l1<i,j<n 


Re = 


算法 7.3 Floyd 算 法 

1. fori=]1 tondo 

2 for j=1 ton do 

3 if i=j then d(i,D 0 D ei 

4 else if <i,j> eE then di wi ) hi 
5. else d(i,)¢+ oh(i,)) 0 //h(i, 门 二 0 表示 i 到 j 不 连通 
6. fork=]1 ton do 

还 for ;一 1 ton Ai 世 do 

8 for j=1 to n Aj 获 do 

9 if di D>di,k) +dk,j) then 

10. di edik) td) hi hisk) 
i 计 d(i, 让 过 0 then return" 存 在 负 回 路 " ,d,h 


12. return d,h 


例 7.3 求 图 7.7 中 任意 两 点 之 间 的 最 短路 径 . 
解 用 Floyd 算 法 ,计算 过 程 如 下 : 


0 =1i 于 w 和 
| 区 wo 鼻 记 
和 | 1 0 4 
4 十 m 二 am 0 四 0 0 证 
- 一 1 1 +o] n 2 各 全 
Hi OL ol jm ll 2H0 
ji 1 和 一 有 
4 让 机 二 | 
0 一 1 0 十 呵 1 多 艺人 的 
| 
2 二 和 妆 通 
4 34 0 bu 
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et 写 - 一 世 2 
| 站 有 到 2 
2 10—1 Dd 
[4 34 0 1 1 4 
jo = % =1 有 光 
| 
2 10—1 1 沽 胡 
[4 34 0 和 让 


根据 输出 的 da 和 h% ,可 以 得 到 任意 两 点 之 间 的 最 短路 径 和 距离 . 例如 ,由 d* (1,4) 一 
一 1,h9 (1,4)= 二 2,h (2,4) 二 3,h (3,4) 一 4, 得 到 顶点 1 到 顶点 4 的 最 短路 径 是 1-2- 
3-4, 距 离 为 一 1. 又 如 ,由 4d(3,2) 二 1,h(3,2) 二 1,h(1,2) 二 2, 得 到 顶点 3 到 顶点 2 的 
最 短路 径 是 3-1-2 ,距离 为 1. 

不 难 证 明 ,Floyd 算法 的 时 间 复 杂 度 为 O(n ). 


7.2.2 最 小 费用 流 的 负 回 路 算法 


设 容量 -费用 网 络 N= 二 过 V,E,c,w,s,t 二 ,f 是 N 上 的 一 个 可 行 流 ,将 定义 7.4 中 关于 
/的 辅助 网 络 N(/) 推 广 到 容量 -费用 网 络 , 记 作 NC 门 = 二 V,E(f/),ac,aw,s,t 记 ,其 中 
E( 有 和 ac 仍 由 式 (7.5) 给 出 ， 


I w(i,j), SE EC 
aw(i,j) = Wie (7.9) 
人 若 过 i,j >E Ef) 
aw 称 作 辅 助 费 用 . 
下 述 引 理 是 引 理 7. 5 在 容量 -费用 网 络 上 的 继续 . 
引 理 7.9 设 /是 容量 -费用 网 络 N 上 的 可 行 流 ,g 是 辅助 网 络 N(/) 上 的 可 行 流 ,/' 二 
f+g, 则 
wf’) = wf) +aw(g) 
可 类 似 引 理 7. 5 中 的 v1) 二 wv(/) 十 v(g) 证 明 . 
定义 7.8 设 N=<V,E,c,w,s,t,C 是 NN 中 一 条 边 不 重复 的 回路 ,E(C) 是 C 的 边 
集 . C 上 的 圈 流 hc 定 义 如 下 : v<i,j>eE(C) ,hc(i,j))=6; Vv<i,j>eE 一 E(C) ,h(i,j) 二 
0, 其 中 6 二 0 称 作 的 环流 量 . 
显然 ,h“ 是 一 个 可 行 流 ， 
u(hc) 一 0， wh) =6. wC) (7. 10) 


其 中 wO) = 2》) (ij). 


<ij>EE(O 
设 f 是 N 上 的 一 个 可 行 流 ,h° 是 N(/) 上 的 一 个 圈 流 ,了 二 /十 he. 根据 引 理 7.5 和 引 
理 7.9, 帮 是 N 上 的 可 行 流 , 且 vw(f1)==v(f),w(f1) 二 w() 二 6aw(C). 如 果 C 是 N(f) 
中 以 辅助 费用 aw 为 权 的 负 回 路 , 即 aw(O) 过 0, 则 ww(f1) 二 w(/). 据 此 ,自然 会 想到 下 述 求 
最 小 费用 流 的 做 法 : 首先 求 一 个 流量 vw 的 可 行 流 f/. 如 果 NCAP) 中 存在 权 aw 的 负 回 路 C， 
令 /<f 十 h5 ,重复 进行 ,直至 辅助 网 络 中 不 存在 权 aw 的 负 回 路 为 止 . 
例 7.4 容量 -费用 网 络 N 及 其 流量 vo 一 8 的 可 行 流 f 如 图 7. 8(a) 所 示 , 其 中 每 一 条 
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边 旁 边 的 两 个 数 依次 是 容量 和 费用 . ww(/) 二 42. 图 7.8(b) 是 N(/), 粗 线 是 一 条 负 回 路 C， 
aru(C) 一 一 1, 圈 流 hc 的 环流 量 等 于 3,aw(h°)= 二 3X( 一 1) 二 一 3. 图 7.8(c) 是 N 上 的 可 行 
流放 = 二 f 十 he,w(f1)= 二 42 一 3 二 39. 


图 7.8 


关键 是 , 当 N(/) 中 不 存在 权 are 的 负 回 路 时 ,/ 是 否 一 定 是 最 小 费用 流 ， 下 面 对 此 进 
行 更 深入 的 研究 . 

定义 7.9 设 广 ,有 户 是 N 王 <V,E,c,w's,t 二 上 的 两 个 可 行 流 , 在 N(f;) 上 定义 g= 
放 一 /2 如 下 : 

VY<isj 六 EE 车 有)>fo(is)); 则 gCi7)= iG) 一 fo(is7)3 车 fi(is7) 过 fi 
(站) 则 gj) 让 二 f2(i, 站 一 用 (i, 让. 在 NCAP) 的 其 他 边 上 sg 都 为 0. 

引 理 7.10 设 有 1,f 是 N= 二 V,E,c,w,s,t> 上 的 两 个 可 行 流 ,g= 二 1 一 /1, 则 g 是 
N(f:) 上 的 可 行 流 且 f= 二 fs 十 g. 

可 类 似 引 理 7. 5 证 明 . 

引 理 7.11 如 果 N 上 的 可 行 流 /不 是 零 流 且 wv(/) 二 0, 则 /等 于 若干 个 圈 流 之 和 . 

证 记 巨 ={<i,j 记 EE | 7 二 0) ,Di 是 已 的 导出 子 图 . 由 于 了 不 是 零 流 ,Ez2 
又 由 于 wv(/) 二 0,Di 中 的 每 个 顶点 的 出 度 大 于 0. 不 难 证 明 ,Di 中 必 存 在 边 不 重复 的 回路 
G. 设 仙 二 min{f(i,j) | 过 i,j 之 eE(C1)} ,Ga 是 Ci 上 环流 量 2 的 圈 流 . 

令 用 二 /一 ha .oo( 广 )=0 且 所 比 了 至 少 多 一 条 零 流 边 如果 户 还 不 是 零 流 , 则 重复 上 
述 做 法 ,得 到 圈 流 1c: ,fs 二 用 一 h%: = 二 /一 h9 一 Ac . 由 于 了 只 有 有 限 条 非 零 流 边 , 故 存在 1/ 
使 得 f= 二 /一 hs 一 hs 一 … 一 h9 为 零 流 , 从 而 /一 Ac 十 Ac 十 … 十 Ac .说 明 : 这 里 十 和 一 都 
是 在 玉 上 两 个 函数 通常 的 加 和 减 . 

定理 7.5 设 / 是 N 上 流量 vo 的 可 行 流 , 则 了 是 最 小 费用 流 当 且 仅 当 N(7) 中 不 存在 
以 辅助 费用 aw 为 权 的 负 回 路 . 

证 必要 性 前 面 已 经 证 明 . 现在 证 明 充 分 性 ,假设 N(f) 中 不 存在 关于 aw 的 负 回 路 . 

设 是 N 上 任 一 流量 ve 的 可 行 流 . 令 g 王 广 一 /由 引 理 7. 10 和 引 理 7.5,g 是 NA 
上 的 可 行 流 且 w(g) 一 0. 不 妨 设 广 太 ,于 是 g 不 是 零 流 . 由 引 理 7. 11, NA 中 存在 回路 C1， 
Cs ,…:C' 使 得 5 一 2c 十 hc 十 … 十 2 .8g& 的 辅助 费用 

aw(g) 一 Ooa(C) 十 0 aw(C2) TO ar(CC) 

其 中 8. 二 0 是 1 的 环流 量 (1 委 r 私 2). 由 于 N(/) 中 不 存在 关于 权 aw 的 负 回 路 ,所 有 
aw(C,) 宇 0, 从 而 aw(g) 宇 0. 又 由 引 理 7.9.f==f+g.w(f)== w() 十 aw(g) 宇 w(f). 得 
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证 f 是 最 小 费用 流 . 
根据 定理 7.4, 下 述 算法 可 以 正确 地 求 得 最 小 费用 流 . 


算法 7.4 最 小 费用 流 的 负 回 路 算法 

1. 调用 最 大 流 算法 , 若 求 得 流量 w 的 可 行 流 /, 则 转 步骤 2; 若 最 大 流量 小 于 vw, 则 输出 “无 流量 w 的 
可 行 流 ”, 计 算 结束 . 

2. 构造 NC(/). 

3. 用 Floyd 算法 检测 NCAP) 中 是 否 存在 权 are 的 负 回路 . 若 存在 负 回 路 C, 则 转 步 又 4; 若 不 存在 负 回 
路 , 则 输出 六 计算 结束 . 


4. 令 94minfac(ij) | <i,j> eE(O)} /Vi 的 环流 量 为 3 

5. VY<iyj 这 EE(0) ,车 <<i,j>EE, 令 (fi 站 +6; 车 ji>eE, 令 ODef(j,i) 一 6. 
HF AIH 

6. 转 步 又 2 


下 面 讨论 算法 7.4 的 有 限 终 止 性 . 假设 所 有 的 容量 都 是 整数 ,算法 计算 过 程 中 的 可 行 
流 都 是 整数 值 , 圈 流 的 环流 量 也 是 整数 ,大 于 等 于 1. 以 N 的 顶点 集 V 为 项 点 集 的 完全 有 向 
图 DD 中 只 有 有 限 个 边 不 重 的 回路 , 记 以 are 为 权 的 所 有 负 回 路 的 权 的 绝对 值 的 最 小 值 为 
w" .每 个 N(/) 都 是 DD 的 子 图 ,其 负 回 路 的 权 的 绝对 值 不 小 于 w*. 设 了 是 流量 we 的 初始 
可 行 流 , 那 么 步骤 2 一 6 的 循环 至 多 进行 w(/)/w"* 次. 因此 ,算法 必 在 有 限 步 内 终止 . 


7.2.3 最 小 费用 流 的 最 短路 径 算 法 


求 最 小 费用 流 的 另 一 个 很 容易 想到 的 做 法 是 ,从 一 个 初始 的 最 小 费用 流 /( 如 零 流 ) 开 
始 ,如 果 v(/) 二 vo , 找 一 条 费用 最 少 的 s-t 增 广 链 卫 ,修改 P 上 的 流量 ,得 到 新 的 可 行 流 矿 . 
重复 进行 ,直至 流量 等 于 wo 为 止 . 

要 证 明 这 个 想法 是 正确 的 ,只 需 证 明 这 样 得 到 的 /也 是 最 小 费用 流 ， 下面 先 证 明 一 个 
预备 知识 . 

引 理 7.12 设 有 向 图 D=< 二 V,E> 没 有 孤立 点 ,顶点 s 的 出 度 比 入 度 大 1,t 的 入 度 比 
出 度 大 1, 其 余 顶 点 的 出 度 等 于 入 度 . 则 D 可 表 成 一 条 s-t 路 径 与 若干 条 回路 的 并 . 

证 从 ;开始 , 沿 一 条 边 到 另 一 个 顶点 . 由 于 除 s 和 + 外 每 个 顶点 的 入 度 等 于 出 度 ,到 
一 个 顶点 后 总 可 以 从 一 条 没有 走 过 的 边 到 另 一 个 顶点 ,一直 走 到 1 为止 . 这 样 得 到 一 条 s-t 
路 径 P. 删 去 P 和 孤立 点 , 剩 下 的 图 中 每 个 顶点 的 入 度 等 于 出 度 , 它 由 若干 条 回路 组 成 .得 
证 DD 可 表 成 一 条 s-t 路 径 与 若干 条 回路 的 并 . 

设 N= 二 二 V,E,c,w,s,t 请 ,f 是 N 上 的 流量 we 的 最 小 费用 流 . 关于 了 的 费用 最 小 的 s-t 
增 广 链 己 是 NCAP 中 权 aw 的 s-t 最 短路 径 ， 由 于 aw 可 以 是 负 的 ,需要 用 Floyd 算法 计算 
P. P 的 边 集 记 作 E(P), 令 6 一 min{ac(i,j) | <i,j>eE(P)}),v<i,j>eE( 有 )， 


0, <i,j>E€EE(P) 
sD = | CR 


0， 否则 
其 中 0~<0<6. g 是 N(f) 上 的 可 行 流 ,v(g) 二 9. 称 作 P 上 流量 9 的 可 行 流 . 
定理 7.6 设 / 是 N 上 的 流量 vo 的 最 小 费用 流 .P 是 N( 由 中 权 aw 的 s-t 最 短路 径 ,8 
是 已 上 流量 9 的 可 行 流 , 则 了 二 /十 g 是 流量 vo 十 9 的 最 小 费用 流 . 
证 v(f)==v( 有 ) 十 v(g) 二 wo 十 0. 假设 了 不 是 最 小 费用 流 , 由 定理 7.5,N(f/ ) 中 存在 
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权 are 的 负 回路 C. 由 于 六 和 上 了 仅 在 对 应 尸 的 增 广 链 上 不 同 , 尼 ( 广 ) 一 下 (六 一 定 与 己 有 


关 


. 因而 , 若 天 i,)>EE(CP) 一 ECP), 则 必 有 天) 之 EECP). 因为 了 是 最 小 费用 流 ,NCP 
中 不 存在 负 回 路 ,所 以 C 中 必 有 不 属于 E( 了 ) 的 边 , 设 它们 是 二 i, 广 记 ,过 i ,js 记 ，…， 


之 i sj: 这 ,有 过 刘 , 谋 之 ,之 jz; 记 这 ,… ,过 j,i 之 eE(P). 记 这 27 条 的 边 集 为 电 , 从 PP 和 
C 构成 的 子 图 中 删 去 五 和 孤立 点 , 记 作 D, 这 里 把 PP 和 C 中 相同 的 边 作为 两 条 平行 边 . 


显然 ,D 满足 引 理 7.11 中 的 条 件 ,可 以 表 成 一 条 s-t 路径 P' 和 回路 Ci ,Cs,*… ,Ci 


于 是 ， 
aw(D) = aw(P’) T+aw(C) +aw(C,) + 二 +aw(C) 
而 aw( 理 ) = 二 0, 得 
aw(P)++aw(C)= aw(D)+aw(H) 
= aru(P') 十 aru(Ci) 十 aru(Cs) 十 … 十 aru(CC) 
aw(P’) 一 am(P) 十 ao(C) 一 ar 人 Ci) 一 au(Cs) 一 … 一 ao(CC') 


的 并 . 


注意 到 C, ,Cs,… ,Cl 是 N( 有 ) 中 的 回路 ,f 是 最 小 费用 流 , 故 aw(C1) ,aw(Cs),…,aw(C1) 均 


非 负 . 而 aw(0) 二 0, 推 出 aw(P') 二 arw(P) ,与 已 是 最 短路 矛盾 


算法 7.5 ”最 小 费用 流 的 最 短路 径 算法 . 

1. /Hvevo // 取 零 流 作为 初始 最 小 费用 流 
2. 构造 NC/) 

3. 调用 Floyd 算法 计算 NC/) 中 以 are 为 权 的 s-: 最 短路 径 

4. 计 NGC 中 不 存在 >: 路 径 then 

6, return "无 流量 w 的 可 行 流 " /是 最 大 流 且 wv(/) 二 wo 
6, else 设 求 得 的 最 短路 径 为 P 

7. 04min{u,min{ac(GiJ) | <i,j> eE(P))}} 

8. for <i,j>eE(P) do 

9 if <i,j>eE then fCGi,))f(i,)) +0 

10. else f(j iD ef(j,i)—0 

11. vev—0 

12. if v>0 then goto 2 

13. return f/ 


零 流 是 流量 为 0 的 最 小 费用 流 , 定 理 7.6 保证 算法 7.5 输出 的 了 是 流量 we 的 最 小 费用 


流 . 算法 7.5 的 有 限 终止 性 类 似 最 大 流 的 FF 算法 . 
在 算法 7.5 中 用 Ford 算法 代替 Floyd 算法 要 更 好 些 . Ford 算法 可 以 求 无 负 


7.3 运输 问题 


回路 的 赋 


第 6 章 例 6. 3 是 一 个 运输 问题 ,运输 问题 又 称 Hitchcock 问题 ,是 T. C. Hitchcock 等 人 


F 1941 年 提出 的 . 它 的 一 般 提 法 如 下 . 


运输 问题 及 个 产地 Ai.As,….A 和 个 销 地 Bi.B;,…,B,,A; 的 产量 为 a;,Bj; 的 
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销量 为 六， 从 A: 到 B; 的 单位 运费 为 ws ,Ts<i<m,1<j<w 假设 产销 平衡 , 即 》)a; 一 


>， 试制 订 凋 运 方案 使 得 总 运 运费 最 少 . 
作 赋 权 完 全 二 部 图 G 王 和 二 A,B, 眉 ,ww>> ,其 中 A=(Ai| 1<i<m },B={B;| 1<j<n }， 

E={(A;,B;) | 1<i<m,1<j<n },w:E -RR* ,如 图 7.9 所 示 . 
如 果 


zz 一 ai 1 委员 
(7. 12) 
Dx = 65, Ts 


xy 宇 0， li<m, l<j<n 
则 z= {xs}) 称 作 一 个 调运 方案 . 调运 方案 z 的 总 费用 


w(x) = 六 Sa 
运输 问题 是 求 使 w(x) 最 小 的 调运 方案 x. 
约束 条 件 (7. 12) 中 前 mm 个 等 式 之 和 的 左 端 与 后 个 等 式 之 和 的 左 端 相同 , 都 等 于 
p33 ， 因 而 它们 的 右 端 也 必须 相等 , 即 a 了 5 这 就 是 产销 平衡. 


i=1 j=1 


产销 平衡 并 不 是 本 质 性 的 要 求 . 当 产 大 于 销 ( 即 > Sy ) 时 ,引入 一 个 虚拟 的 销 


让 可 


地 Bn ,其 销量 bn 一 Da» 供给 B,+ 的 产品 实际 上 是 未 售 出 的 剩余 产品 ,就 地 存 
储 , 其 单位 运费 rwi,st 一 oe <i i < m). 于 是 ,问题 转化 成 个 产地 和 nn 十 1 个 销 地 的 运输 


问题 ,满足 产销 平衡 的 要 求 : De = 一 $Y,. 


d= 


当 销 大 于 产 ( 即 a < 76) 时 ,与 上 面 类 似 ,引入 一 个 虚拟 的 产地 Ann， 其 产量 为 


amd -> 一 Au 的 供 货 实际 上 是 缺 货 , 自 然 也 有 wn,; = 0(1 过 7 入 四 ， 


可 以 把 运输 问题 看 作 最 小 费用 流 问 是 添加 一 个 发 点 s 和 一 个 收 点 +, 作 容量 -费用 网 
络 N= 二 二 V,E,c,w,s,t 这 ,其 中 : 
V={s,t,Ai,As,…,A, ,Bi,B,,.…,B,)} 
E={<s,A; 二 |1<i<m}U{<B,t>>|11<j<n)} 
Ui{=<A,B;> |1<i<m,l<i<n)} 
cssAi) =a, wssAi)=0, li<m 
cc(Bj,t)=b, wBj,t)=0, lj<n 
c(Ai,B;) =+%, w(Ai,B;))=ws, li<<m, lj<<n 


网 络 流 算法 


见 图 7. 10. 流量 wm = 的 可 行 流 恰好 对 应 运输 问题 的 调运 方案 . 总 运费 最 小 的 调运 方 
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案 就 是 流量 w 一 > 的 最 小 费用 流 . 


下 面 根据 最 小 费用 流 的 负 回路 算法 导出 运输 问题 的 
位 势 算法 . 


7.3.1 确定 初始 调运 方案 


如 下 确定 初始 调运 方案 : 选取 一 条 边 (Ai,B), 令 < “图 7.10 
min{ai,b;)}， 车 ai 二 by, 则 删 去 A; 及 其 关联 的 边 , 令 bj < 革 
bj 一 Qi; 车 wu 二 注 , 则 删 去 B; Se ai<ai 一 bj;; 车 ai 一 b;, 则 再 选取 一 条 与 A; 关 
联 或 与 B; 关 联 的 边 ,比如 (A;,Bi) ,kk 发 , 令 xa 一 0, 删 去 A; 和 Bj 及 其 关联 的 边 . 重复 进行 ， 
直到 选取 了 加 十 n 一 2 条 边 ， 此 时 只 下 一 条 边 (A,,B,) 且 ww 一 六, 选取 (A,,B,), 令 zw 全 
ap. 其 余 边 上 的 z 值 均 为 0. 记 选 中 的 mw 十 n 一 1 条 边 的 集合 为 工 , 称 作 选中 边 集 . 不 难 验 
证 ,zx 二 {x;) 满 足 约束 条 件 (7. 12) ,是 一 个 调运 方案 . 

命题 7.2 初始 调运 方案 选中 的 m 十 n 一 1 条 边 工 构成 G 的 一 棵 生成 树 . 

证 G 有 mm 十 nn 个 顶点 ,TT 有 光 十 n 一 1 条 边 , 只 需 证 的 导出 子 图 是 连通 的 . 为 了 方 
便 , 把 工 的 导出 子 图 仍 记 作 TT. 对 G 中 的 顶点 数 m 十 n 做 归纳 证 明 . 

当 mm 十 n= 二 2 时 ,m= 二 1,n 二 1 ,结论 显然 成 立 . 

假设 当 mw 十 n 硅 k(k 三 2) 时 ,结论 成 立 ， 要 证 m 十 n= 二 k 十 1 时 ,结论 也 成 立 . 设 选中 的 
第 一 条 边 是 (Ai,Bj). 车 ai 二 b;,G 删 去 A; 及 其 关联 的 边 记 作 G' , 工 删 去 A; 和 (Ai,Bj) 记 作 
T'. G' 是 个 顶点 的 完全 二 部 图 ,TT 是 从 G 中 选中 的 k 一 1 条 边 . 根据 归纳 假设 ,TT 是 连 
通 的 . 而 (Ai;,B;) 连 接 T' 和 A;, 故 本 是 连通 的 . 若 a; 记 6b;, 可 类 似 证 明 工 是 连通 的 , 若 
qi 二 b， 要 选中 两 条 边 : 一 条 是 (A;,B;); 另 一 条 是 与 A; 关 联 或 与 Bj 关联 的 边 ,不妨 设 是 
(Ai,Bi),k 坟 . G 删 去 A; 和 B; 及 其 关联 的 边 记 作 G' ,TT 删 去 A; 和 Bj; 及 (A;,B,) 和 (Ai,B) 
记 作 区. G' 是 一 1 个 顶点 的 完全 二 部 图 ,T 是 从 G 中 选中 的 k 一 2 条 边 . 根据 归纳 假设 ， 
T' 是 连通 的 . 而 (Ai, Bo) 连接 TT 和 (Ai;,Bj), 故 工 是 连通 的 . 得 证 当 罗 十 2 一 人 十 1 时 结论 
也 成 立 ， 

在 前 面 确 定 初 始 调运 方案 的 算法 中 ,没有 具体 规定 如 何 选择 边 , 可 以 有 多 种 选择 边 的 标 
准 , 导 出 多 种 确定 初始 调运 方案 的 算法 . 一 个 常用 的 标准 是 ,每 次 在 剩余 的 边 中 选择 单位 运 
费 wj 最 小 的 边 , 称 作 最 小 元 素 法 . 


7.3.2 改进 调运 方案 
设 了 6A 5B;) | 1 委 r 生 im 十 2 一 1}. 给 每 个 顶点 一 个 变量 ,wi 对 应 A;(1 委 ;i 委 加) ,vw 


对 应 B;(1 二 jj 三 n). 对 应 每 一 条 选中 边 (A; ,B;, ) 有 一 个 方程 

Us Ti, = Wwij,» 1 三 r 达 m+ 二 +n 一 1 (C7. 133 
这 是 m 十 n 个 变量 ,m 十 n 一 1 个 方程 的 线性 方程 组 .有 无 穷 多 组 解 . 很 容易 找到 它 的 一 
解 , 称 作 G 的 顶点 的 位 势 . 记 


Ms = ws C—O— Yi (7.14) 


摹 法 证 计 与 分 新 (入 2 版 ) 


称 作 边 (A, ,Bi ) 或 六 的 检验 数 ,1 近 ij 和 证 :1 所) 委 2。 选中 边 的 检验 数 均 为 0. 

调运 方案 x 对 应 容量 -费用 网 络 N 上 的 一 个 流量 w 的 可 行 流 , 也 记 作 z. 由 于 离开 ;的 
边 和 进入 t 的 边 都 是 饱和 边 ,不 在 N(x) 中 出 现 , 故 NCz) 中 任意 一 条 回路 C 不 可 能 经 过 和 
t, 从 而 C 是 G 中 的 一 条 回路 . 注意 到 , 非 选中 边 都 是 零 流 边 ,只 能 从 A 到 B. 而 选中 边 既 是 
非 饱 和 边 又 是 非 零 流 边 , 可 以 从 A 到 B. 是 前 向 边 , 也 能 从 B 到 A ,是 后 向 边 . 

根据 图 论 的 相关 知识 ,在 G 中 对 应 每 一 条 非 选中 边 (A;,B;), 它 不 在 生成 树 工 中 ,存在 
唯一 的 一 条 由 (Ai;,B;) 和 工 中 的 边 (选中 边 ) 组 成 的 基本 回路 C;. 从 A; 开 始 对 工 做 广度 优 
先 搜索 ,找到 从 A; 到 Bj 在 T 中 唯一 的 路 径 , 再 加 上 (Ai; ,Bi ) 就 得 到 Cj;. 记 记 二 i,jo 二 j. 设 
Ci 二 Ai Bj Ai B;…B;,A; :注意 到 从 B 到 A 的 边 都 是 后 向 边 ,C; 的 权 

WC —win — wh wi — wh + wos, Wi 


—wai™— Cw To us 0 一 人 Twi eu Tw buy tw) 


i 
o 


=wWwah — Wh — WwW 


w(Cs) = hs Gc 
如 果 和 到 0, 记 0 一 min{zi | 0 委 r 委 四)} ,这 里 规定 io。=ip+1==iyjo==j. 对 1<k<m， 
1 委 / 委 2 , 令 
za 十 6， 若 k=ii l=j 
Zh 一 C7 
hs 否则 
也 就 是 以 (A, ,Bi) 作 为 第 一 条 边 ,8 是 Cy 中 第 偶数 条 边 上 z 的 最 小 值 ,对 Ci 中 第 奇数 条 边 
上 的 x 加 5, 第 偶数 条 边 上 的 z 减 8, 其 余 的 xz 不 变 ,得 到 x“. 
设 e 是 Cr 上 第 偶数 条 边 中 z 值 最 小 (等 于 6) 的 边 , 若 有 多 条 这 样 的 边 , 则 任 取 其 中 的 一 
条 . x' 在 e。 上 的 值 为 0, 以 (Ai,Bi) 换 e, 即 从 工 中 删 去 e\ 加 入 (A,Bi) ,得 到 新 的 选中 边 
靠 吕 
上 述 操 作 称 作 选 中 边 变换 , (A;.B;) 称 作 换 入 边 ,e 称 作 换 出 边 , 又 称 x; 是 换 入 变量 ， 
< 上 的 z 是 换 出 变量 . 
不 难 验 证 下 述 结论 . 
引 理 7.13 设 对 调运 方案 x 和 对 应 的 选中 边 集 T 做 以 (A;,B,) 为 换 入 边 的 选中 边 变换 
得 到 x’ 和 T', 换 出 变量 的 值 为 6, 则 x 也 是 一 个 调运 方案 ,对 应 的 选中 边 集 为 T', 且 
wx) = wz) to Ns 
由 于 入 二 0,6 宇 0,x' 是 一 个 总 费用 更 小 、 至 少 是 不 增加 的 调运 方案 . 如 此 重复 进行 , 直 
到 所 有 的 检验 数 15 三 0 为 止 . 下 述 定理 表明 这 样 得 到 的 调运 方案 是 最 优 的 . 
定理 7.7 一 个 调运 方案 是 总 费用 最 小 的 调运 方案 当 且 仅 当 所 有 检验 数 大 于 等 于 0. 
证 必要 性 上 面 已 经 证 明 . 现 在 证 明 充 分 性 . 设 所 有 检验 数 Xj 三 0, 根 据 定理 7.5, 只 需 
证 G 中 没有 权 w 的 负 回 路 . 由 式 (7.15), 所 有 的 基本 回路 都 不 是 负 回 路 . 假设 C 是 一 个 负 
回路 ,那么 C 上 至 少 有 两 条 非 选 中 边 . 任 取 C 上 的 一 条 非 选 中 边 (A,.Bi) ,对 应 的 基本 回路 
Gs 二 Xi"…AiB;…XX2…Y…X1 ,其 中 Xi 和 Xs: 分 别 是 边 (A;,Bi) 两 侧 与 C 连续 重合 部 分 的 最 
远 端点 ,C 二 XIAiBiX ZX 当然 ,C5 中 和 …Y…Xi 部 分 与 C 中 XXZX 部 分 


网 络 流 算法 


也 可 能 还 有 重合 . 时 图 7.11; 令 C= Xs Ze Xl …Y…X, .C 中 其 与 Gs 中 Xa 

Y…X; 是 方向 相反 的 同一 段 ,从 而 w(Cs) 十 w(C’) 二 

w(0) ,推出 w(C') 三 w(C). Cs 中 除 (A;,B;) 外 都 是 选 

中 边 ,因此 C' 是 比 C 少 一 条 非 选 中 边 的 负 回 路 . 重复 

进行 ,最 后 得 到 一 个 只 含 一 条 非 选中 边 的 负 回 路 ,这 是 

权 为 负 的 基本 回路 ,与 所 有 检验 数 都 大 于 等 于 0 矛盾 . 
算法 7.6 位 势 算法 . 

. 求 初始 调运 方案 zx 和 选中 边 集 工 

. 解 线 性 方程 组 (7. 13) ,得 到 位 势 u,v 

. 计算 检验 数 为 二 tw 一 wi 一 韦 

. if Xm =min{Aj )} 人 0 then return x 

.以 (A,,B,) 为 换 入 边 做 选中 边 集 变换 ,变换 结果 仍 记 作 和 

. goto 2 


2 
3 
4 
5 
6 


正如 例 6. 3 中 所 示 的 那样 ,运输 问题 可 以 表示 成 线性 规划 , 实际 上 ,选中 边 集 T 恰 好 对 
应 可 行 基 , 对 应 工 的 调运 方案 是 基本 可 行 解 , 这 里 的 检验 数 也 就 是 线性 规划 中 的 检验 数 ,而 
位 势 u,v 是 对 偶 规划 的 对 偶 变量 ,选中 边 集 变换 就 是 基 变换 , 因而 ,和 单纯 形 法 一 样 ,如 果 
调运 方案 中 选中 边 的 变量 恒 大 于 0( 问 题 是 非 退 化 的 ) , 则 位 势 算法 必 在 有 限 步 内 终止 ,否则 
不 能 保证 算法 在 有 限 步 内 终止 . 


7.3.3 表 上 作业 法 


当 用 手 算 时 ,在 表 上 进行 要 方便 得 多 . 下 面 通过 例 6. 3 的 计算 来 说 明 如 何在 表 上 作业 . 在 
表 7.1 中 ,中 间 的 每 个 方 格 对 应 二 部 图 G 的 一 条 边 , 方 格 右 上 角 的 小 方 框 内 的 数 是 单位 运费 
zy， 方 格 内 的 数 是 初始 调运 方案 zx; ,旁边 小 圆圈 内 的 数字 是 用 最 小 元 素 法 选择 边 的 顺序 . 空 
白 的 方 格 是 非 选中 边 , 上 面 的 xz; 二 0. 计算 位 势 的 过 程 如 下 , 令 任意 一 个 妊 或 也 等 于 一 个 任意 
的 值 , 然 后 根据 选中 边 的 wy 逐个 确定 其 他 变量 的 值 . 如 这 里 , 令 由 一 2, 由 ra 一 3 一 2, 得 
不 一 1; 由 ws 一 2, 二 2, 得 wv 二 0; 由 wa 二 7,wv = 二 1, 得 ws 二 6; 由 ws 一 2 一 6, 得 办 4, 


表 7.1 初始 调运 方案 x” 和 位 势 


Bl 及 B; | 产量 mw Wi 
4 19H4o2 HH gu|l2 
4 |5@L7 5l1I@2| sls 


销量 by| 《 5| 4 入 11 
yy 0 -4 


初始 调运 方案 xm 的 检验 数 二 wos 一 w 一 纪 列 于 表 7. 2 中 的 小 方 框 内 . Xs 二 一 1, 找 一 
条 从 这 个 方 格 开始 .由 横竖 线段 组 成 .其 余 转 折 点 都 是 有 数字 的 方 格 (选中 边 ) 的 回路 C, 如 
表 中 虚线 所 示 . 回路 可 能 有 各 种 不 同 的 形状 ,图 7. 12 
给 出 几 种 形状 . C 的 偶数 顶点 处 rz 二 4, zw 一 5.6 一 
min{4,5) 二 4. 从 空白 方 格 开始 , 沿 C 加 4 减 4, 得 到 = ed [C5 
图 7.12 


Zz ,并 将 za 的 方 格 变 成 空白 方 格 ,如 表 7. 3 所 示 . 


第 
这 
章 


算法 谈 计 与 分 帮 ( 血 2 版 ) 


重新 计算 x” 的 位 势 和 检验 数 . 表 7.4 中 x 的 所 有 检验 数 hy 宇 0, 故 xz” 是 总 费用 最 小 的 
调运 方案 . 


表 7.2 x 的 检验 数 和 回路 


Bl 已 By | us 
14|153 2 Hs 
本 14 

vy | ul 村 


表 7.4 x 的 检验 数 
B |B |B 
Enel 


4 | 1 
4 | 5 | 


4 


| 
| 
ib 


7.4 二 部 图 匹配 


7.4.1 二 部 图 的 最 大 匹配 


定义 7.10 设 简单 二 部 图 G= 一 A,B,E>,M ,如果 M 中 任意 两 条 边 都 不 相 邻 , 则 
称 M 是 G 的 匹配 . G 的 边 数 最 多 的 匹配 称 作 最 大 匹配 。 当 |A|= 二 1B|==n 时 , 边 数 为 n 的 匹 
配 称 作 完美 匹配 . 
例 7.5 有 4 名 新 人 学 的 硕士 生 和 4 位 硕士 生 导师 .硕士 生 A; 申 请 Bi、Bs 或 B, 作 为 导 
师 ,A,、A, 和 A, 都 申请 Bi 或 B, 作 为 导师 . 每 名 硕士 生 有 一 位 导师 .每 位 硕 导 只 收 一 名 新 生 . 
试制 订 分 配方 案 , 尽 可 能 地 满足 学 生 的 要 求 . 
作 二 部 图 G= 二 A,B,E 二 ,其 中 
A=1{Ai|1<i<4} 
B= 1{B|1<7<4)} 
E 二 {(Ai,B;) | A; 申请 B; 作为 导师 .1 <i<4,1 过 jj 过 44) 


如 图 7. 13 所 示 . 问题 转化 为 求 G 的 最 大 匹配 . 站 
定义 7.11 设 M 是 二 部 图 G 的 匹配 , 称 M 中 的 边 为 匹配 

边 ,不 属于 M 的 边 为 非 匹 配 边 ,与 匹配 边关 联 的 顶点 为 饱和 [4S 

点 ,不 与 匹配 边关 联 的 顶点 为 非 物 和 点 .G 中 由 匹配 边 和 非 匹 


配 边 交 替 构 成 的 路 径 称 为 交错 路 径 , 起 点 和 终点 都 是 非 饱 和 点 4 人 人 4 
的 交错 路 径 称 为 增 广 交 错 路 径 . 图 7.13 
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关于 匹配 有 下 述 结果 ,相关 证 明 请 参阅 文献 [1]. 

引 理 7.14 设 M 是 二 部 图 G 的 一 个 匹配 ,P 是 一 条 关于 M 的 增 广 交错 路 径 , 则 M' 二 
Me 人 E(P) 是 一 个 匹配 且 |M' | 二 1M| 十 1, 其 中 E(P) 是 P 的 边 集 . 

MEE (P) 一 MUE(P) 一 MNE(P), 即 把 M 中 PP 上 的 匹配 边 换 成 P 上 的 非 匹 配 边 . 例 
如 ,图 7.14(a) 中 , 粗 线 ( 实 线 和 虚线 ) 是 匹配 M={(As ,B; ),(A: ,B:),(A,,B:)) ,虚线 ( 细 
线 和 粗 线 ) 是 增 广 交错 路 径 P=AiBA;B,AsB,,E(P)={(Ai,B),(A;,B),(A:,B,)，, 
(A:,B:)， (As BD)) MEE(P)={(Ai1,Bi),(As ,Bs),(As, Bi), (A Bi))， 见 图 7.14(b) 
中 粗 线 . 


Bl Bb B; Bb, 


定理 7.8 二 部 图 的 匹配 是 最 大 匹配 当 且 仅 当 不 存在 关于 它 的 增 广 交错 路 径 . 

根据 上 述 结 果 不 难 设计 出 下 述 二 部 图 的 最 大 匹配 算法 ,通常 称 作 匈牙利 算法 . 算法 的 
基本 做 法 是 ,从 一 个 初始 匹配 M 开始 ,每 次 找 一 条 增 广 交 错 路 径 P, 令 M cM EE (P), 直 到 
不 存在 增 广 交错 路 径 为 止 . 算法 的 主要 部 分 是 用 广度 优先 搜索 寻找 增 广 交 错 路 径 , 类 似 FF 
算法 ,采用 标号 法 . 设 当前 的 匹配 M, 对 A 中 每 一 个 非 饱 和 点 Ai, 令 L(Ai) 二 0,A; 成 为 已 标 
号 未 检查 的 顶点 ,其 他 顶点 都 是 未 标号 的 . 任 取 一 个 已 标号 未 检查 的 顶点 A;, 对 所 有 
(Ai,B;)eE 且 示 标号 的 B;, 令 1(B;) 二 A;,B; 成 为 已 标号 的 . 如 果 B; 是 非 饱 和 点 , 则 已 找到 
一 条 增 广 交 错 路 径 , 修 改 匹配 ,重新 开始 标号 ,如 果 Bj 是 饱和 点 , 设 (Ai,B;)eM, 令 L(A) 二 
Bj ,Ai 成 为 已 标号 未 检查 的 顶点 . A; 成 为 已 标号 已 检查 的 顶点 . 重复 进行 . 直到 A 中 不 存 
在 已 标号 未 检查 的 顶点 为 止 . 

在 下 面 的 算法 中 ,用 match 存储 匹配 M, 若 (A;,B;) eM, 则 有 match(A;,) 王 Bi ,match 
(Bi) 一 Amatch(Ai) 一 0(match(Bi) 一 0) 表 示 A;(B;) 是 非 饱 和 点 . /是 标号 . X 是 A 
中 已 标号 未 检查 的 顶点 集 ,Y 是 B 中 未 标号 的 顶点 集 . 


算法 7.7 匈牙利 算法 

输入 : 二 部 图 G 王 一 A,B,E> 
输出 : match 

1. for rz eAUB do match(Cz)<0 

2. XS // 标 号 开始 
2.1 for A,éeA match(A;)=0 do 

名 和 L(ADOX EXU{A;} 

2.3 Y<B 

3. while X #2do 

1 任 取 AieX ,XX 一 {A;} 

总 澳 for (Ai.B;)eE ABjer do 


第 
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3.3 LU(B eA,Y ¢¥—1{B,} 

3.4 if match(B;)=0 then goto 5 // 存 在 增 广 交 错 路 径 已 
是 else Aitmatch(Bi), LA)<eBi,X<XU(A} 

4. return match // 计 算 结束 

5. Aitt(Bi),match(Bi)eAi,match(A;)< Bi // 回 溯 找 到 P,.M<MEP 
5.1 if L(Ai)=0 then goto 2 // 返 回 开 始 下 一 阶段 标号 
5.2 else Bi4L(Ai) ,goto 5 


例 7.5 中 的 问题 计算 如 下 . 前 两 个 阶段 分 别 从 Ai,As 开 始 ,找到 增 广 交 错 路 径 A, Bi， 
A,B;. 至 此 ,M 二 {(Ai,B1),(As ,Bs)), 如 图 7.15(a) 中 粗 线 所 示 . 接 下 来 一 轮 的 标号 写 在 
顶点 旁 的 [ ] 内 ,得 到 增 广 交 错 路 径 P=B,AiBiA;s,M <M EE(P)=1{(Ai,B,),(A;,B)， 
(As,Bs)). 图 7.15(b) 给 出 这 个 新 匹配 ( 粗 线 ) 及 标号 . 至 此 ,A 中 已 没有 已 标号 未 检查 的 
顶点 ,而 B 中 没有 已 标号 的 非 饱 和 点 ,计算 结束 . M 二 {(Ai,B,),(A; ,Bi),(A, ,Bs)} 是 最 
大 匹配 ,对 应 的 分 配方 案 是 ,Al ,A 和 A; 如愿 地 被 分 配给 B: ,B: 和 Bi, 而 A, 只 能 服从 安排 
师 从 B, 了 . 


图 7.15 


定理 7.9 对 二 部 图 G= 王 二 A,.B,.E> ,匈牙利 算法 终止 时 ,M 是 G 的 最 大 匹配 ,并且 算 
法 在 OC(min{1A|,1B1)-|E|) 步 内 终止 计算 . 

证 在 每 个 阶段 ,如 果 找 到 增 广 交 错 路 径 卫 , 则 令 M cMGEE(P). 开始 时 ,M= 二 @ 是 G 的 
匹配 . 根据 引 理 7. 14, 不 难 归纳 证 明 最 后 得 到 的 M 是 G 的 匹配 。 当 计算 终止 时 ,如 果 存 在 
增 广 交 错 路 径 卫 ,那么 它 的 两 个 端点 都 是 非 饱 和 的 ,从 A 中 的 端点 开始 沿 P 最 后 必 给 B 中 
的 端点 标号 .而 计算 终止 时 B 中 已 标号 的 顶点 都 是 饱和 点 .矛盾 . 

除 最 后 的 阶段 外 ,算法 的 每 个 阶段 (标号 和 修改 M) 增 加 一 条 匹配 边 . 最 多 有 min{1A|， 
1B1} 条 匹配 边 , 故 最 多 有 min{|1A1,1B|} 十 1 个 阶段 . 在 每 个 阶段 内 的 标号 过 程 中 ,每 条 边 
最 多 检查 一 次 , 增 广 交错 路 径 的 长 不 超过 2|M| 十 1, 故 每 个 阶段 可 在 O(|E|) 内 完成 ,得 证 
计算 必 在 OC(min{1A|1,1B|}。|E|) 步 内 终止 . 

简略 地 说 ,算法 的 时 间 复 杂 度 为 O00), 其 中 是 图 的 顶点 数 . 

读者 可 能 早已 发 现 二 部 图 的 最 大 匹配 问题 可 以 转化 成 最 大 流 问 题 . 与 运输 问题 类 似 ， 
给 定 二 部 图 G 王 二 A,B,E>, 作 容量 网 络 Ne 二 <V,E',c,s,t> ,其 中 
V=(stiiUAUB 
交友 | 人 后 下 则 人 坝 和] 人 六 全 到 
每 条 边 的 容量 为 1,c 习 . 

不 难看 出 ,G 的 匹配 与 Ne 上 的 0-1 可 行 流 ( 即 每 一 条 边 上 的 流量 为 0 或 1 的 可 行 流 ) 一 
一 对 应 .前 向 边 是 非 饱 和 边 , 后 向 边 是 饱和 边 , 增 广 链 对 应 增 广 交 错 路 径 . 匈牙利 算法 实际 
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上 就 是 FF 算法 的 应 用 . 
Dinic 算法 比 FF 算法 更 有 效 , 把 Dinic 算法 应 用 于 最 大 匹配 问题 的 效果 如 何 呢 ? 用 
Dinic 算法 解 二 部 图 的 最 大 匹配 问题 的 步骤 如 下 : 
(1) 构造 二 部 图 G 王 一 A,B,E 二 的 对 应 容量 网 络 Ne. 
(2) 对 Ne 应 用 Dinic 算法 (算法 7.2) , 求 得 Ne 上 的 最 大 流 /. f 是 一 个 0-1 可 行 流 . 
(3) 把 了 转化 为 G 的 匹配 M. 
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步骤 (1) 和 步骤 (3) 可 以 在 O(n 十 m) 步 内 完成 .这 里 nn 是 G 的 顶点 数 ,m 是 G 的 边 数 . 
而 在 Ne 中 ,容量 均 为 1,A; 的 入 度 为 1,B; 的 出 度 为 1, 即 Nc 是 一 个 简单 容量 网 络 . 根据 定理 
7.4, 步 骤 (2) 可 在 Ol(mw%m) 步 内 完成 . 可 设 G 中 无 孤立 点 ,于 是 有 下 述 定理 . 


定理 7.10 用 Dinic 算 法 解 二 部 图 的 最 大 匹配 问题 的 时 间 复杂 度 是 OC 人 2m). 
7.4.2 赋 权 二 部 图 的 区 配 


设 赋 权 完 全 二 部 图 G== 二 A,B,E,w, 其 中 A={A;| 1<i<n},B={B,| 1<j<<n}， 
E={(Ai,B;)) | 1<i<n,1<j<n },w:E -RR. 这 里 假设 IA|==1B|, 记 w(Ai,Bj) 一 wy. 现 
在 的 问题 是 , 求 G 的 权 w(M) = ”了 》， ws 最 小 的 完美 匹配 M. 这 个 问题 称 作 指派 


(AirB) EM 
问题 . 

例 7.6 某 单位 有 4 项 任务 由 4 个 人 去 完成 ,每 人 完成 一 项 ,预计 每 个 人 完成 每 一 项 任 
务 的 时 间 如 表 7. 5 所 示 . 如 何 分 配 才 能 使 得 完成 任务 的 总 时 间 最 少 ? 


表 7.5 
任 务 
人 员 

Bi B: Bs Bi 
Ai 9 4 3 11 
六 8 5 8 4 
As 3 8 3 1 
A 10 6 9 6 


作 赋 权 完 全 二 部 图 G= 二 A,B,E,w 放 ,其 中 A={Ai,A;,A;,A,},B= 1{B,B,,B;， 
B1},E={(Ai,B;) | 1<i<4,1j 二 4},w 由 表 7.5 给 出 . 问题 是 求 G 的 最 小 权 完 美 
匹配 . 

指派 问题 是 运输 问题 的 特殊 情况 . W. W. Kuhn 于 1955 年 给 出 指派 问题 的 有 效 算法 ， 
称 作 匈牙利 算法 . 这 是 最 早 的 原始 -对 偶 算法 . 下 面 按 照 原始 -对 偶 算法 的 思路 导出 匈牙利 
算法 . 

念 

1， (4A,, Bi) EM - 
Xi 一 1 二 i 1 六 
{i 否则 
指派 问题 可 表 成 下 述 线 性 规划 
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于 
min 区 > wrs 


t=1 j=1 


有 Dg =1,， li<n 
j=1 


Sy 一 1 1i 和 en 
i=1 


zy 宇 0， 


有 放松 了 对 xz 的 限制 ,与 最 大 流 问 题 类 似 , 后 面 的 解法 总 保证 zy 等 于 0 或 1. 


式 (P) 的 对 偶 规划 是 


过 本 ) 二 沪 


max Dai+t >)8, 
i=1 j=1 

s.t. atpBw,:, l<i<nl<j<n 
ai 任意 ，1 寺 i 
记 任 意 ，1 委 7j 委 7 


(0) 
af 一 0， 


l<i<n 


B® = min{wsy}, l<j<n 


这 是 式 (D) 的 可 行 解 . 记 


其 中 


万 一 (Gao 十 go = vw)} 
根据 互补 松弛 性 条 件 , 式 (P) 的 最 优 解 应 满足 


Sa 一 1， 
i=1 
Ss 一 1， 
[| 


下 要 本 而 


l<j<n 


wy 0 Cell 
Xs =0, (i,j) ¢lJ 
于 是 ,构造 下 述 线性 规划 , 称 作 限制 的 原始 问题 . 


Zn 
min €= Dy 
i=1 


Ss. t. SY 加 训 
j=1 


2 二 0， 
Xis 宇 0， 


Xi 一 0， 


h yi (1 志 k 志 2n) 是 人 工 变 量 . 


天 一 1， 1<i<n 


lak 
(i,7) elJ 
(1.7) ¢IJ 


(P) 


(D) 


Ly 


(RP) 


注意 到 ， 
=— D7 (1— De)t DL— Dy ) 
=1 pg | i=1 
= 2n—2 py Ty 
(DED 
式 (RP) 等 同 于 
max XT 
(DED 


Dzy Sl 1<ij<n 
i=1 

ee | 
zy = 0, (i,j) gI] 
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(RP') 


式 (RP ) 是 二 部 图 G(1])== 二 A,B,E(1J) 放 的 最 大 匹配 问题 ,其 中 A={A;| 1<i<n}， 
B={B;| 1 入 ) 委 四 ,EC(IJD)=((A, Bi) | (i,j) elJ }. 用 算法 7.7 解 这 个 问题 ,得 到 G(IJ) 的 


最 大 匹配 M, 式 (RP') 对 应 的 最 优 解 为 {zy ). 车 |M|=n, 则 >) zx) 一 六 6 一 0. 从 而 {zx ) 


(DED 


是 式 (P) 的 最 优 解 ,最 优 值 为 Xu 二 > ao 十 3B? ,M 是 所 求 的 最 小 权 完美 匹配 . 
i=1 j=1 


CD EN 


如 果 |M|=n, 令 


， /1， Ai 已 标号 ， | 
“= a 
一 1， Bi 已 标号 ， 
= Te 
B; | 1， B, 未 标号 ， jn 


这 里 的 标号 是 指 在 G(1J) 的 最 大 匹配 计算 终止 时 顶点 的 标号 . 


引 理 7.15 oz (1 过 过 四 ,8 (1 志 j 志 ) 是 式 (RP) 的 对 偶 规划 的 最 优 解 . 


证 式 (RP) 的 对 偶 如 下 : 
max > ai 十 > B 
i=1 j=1 


st atBE0 (Cj) el] 
al1, li<n 
B;1, 1l<j<n 
wu 任意 ， l<i<n 
B; 任意 ， 1 委 了 委 于 


VYV(i,j) elJ ,(Ai,B;)eE(1]), 如 果 Ai; 已 标号 , 则 Bj; 也 一 定 已 标号 ,因此 


+pB 寺 0 
得 证 a? (1 二 i 二 nn) ,8 (1 二 j 志 nn) 是 式 (DRP) 的 可 行 解 . 


(DRP) 


又 Vv(A;,B;)eM,A; 和 B; 要 么 都 已 标号 、 要 么 都 未 标号 ,从 而 ai 十 让 二 0. 而 其 余 的 顶 
点 都 是 非 饱和 点 , 非 饱 和 的 A; 都 已 标号 , 非 饱和 的 Bj; 都 未 标号 (否则 找到 一 条 增 广 交 错 路 
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径 ) ,从 而 ar 二 1,B* 一 1. 于 是 
Sar + Dp 2(n—| M|)=2n—2 Bx? =é 


i=1 了 一 1 (DED 
得 证 a? (1 二 i<<n) ,BY (1 二 j 志 nn) 是 式 (DRP) 的 最 优 解 . 
接 下 来 是 用 式 (DRP) 的 这 个 最 优 解 改进 式 (D) 的 可 行 解 ,使 一 些 新 的 (i, 门 进入 了 IJ. 令 
ai = 一 al 十 ba ，1 委 1i 委 2 
Br = "FOR: LSS 


即 
ago 十 9， Ai 已 标号 
a i 
5 玉石 居 标 导 A 
一 0， Bi 已 标 
由 = Ce E se 1 < 
BV 十 9， Bi 未 标号 
由 于 
之 中 | 28” (Ze 28)) 0( Ze | 228 ) 
es de i= j= i= j= 
(Ze 2 ) 0é 
而 >0, 应 取 09>0. 为 了 保证 cf (in) ,8 (Ij 和 nw) 是 式 (D) 的 可 行 解 ,要 求 
wi a +BP= (a® +B")+oa +P) (7.19) 
有 以 下 4 种 可 能 : 
(1) Ai; 已 标号 ,Bj 已 标号 ， 此 时 ,af? 十 8 外 二 at?” 十 B99. 
(2) Ai; 未 标号 ,Bj 未 标号 ,此 时 ,af? 十 8 外 二 af9 十 B59. 
(3) A 未 标号 ,Bj 已 标号 ,此 时 ,af? 十 B84? 一 afo 十 819 一 20. 
(4) Ai; 已 标号 ,Bj 未 标号 ， 此 时 ,a 外 十 B42 二 at? 十 B84? 十 20， 
对 于 前 3 种 情况 , 式 (7.19) 便 成 立 . 根据 情况 (4) ,应 取 
min( 诗 (ws 一 ago 一 89o )|A; 已 标号 ,Bi 未 标号 } (7. 20) 


对 于 情况 (1) 和 情况 (2).G(CIJ) 中 的 边 不 会 改变 . 特别 地 ,对 于 每 一 条 匹配 边 (A, ,Bi )， 
A; 和 了 Bi 要么 都 已 标号 ,要 么 都 未 标号 ,从 而 得 到 的 匹配 M 仍 是 新 二 部 图 的 匹配 . 对 于 情况 
(3) ,如 果 (A,,Bi) 是 原 图 的 边 , 则 在 新 图 中 被 剔除 . 由 于 A; 未 标号 ,标号 的 过 程 与 这 条 边 无 
关 , 所 以 原 有 的 全 部 标号 在 新 图 中 仍然 有 效 . 而 Bj 已 标号 ,有 没有 这 条 边 也 不 会 影响 下 面 的 标 
号 . 关键 在 于 情况 (4) ,一 定 有 一 对 已 标号 的 A; 和 未 标号 的 Bj ,满足 io 十 8 二 wy af 十 
By? 二 wy ,从 而 新 图 得 到 一 条 新 边 (A; ,B,) ,使 得 终止 的 标号 过 程 得 以 继续 进行 . 

这 样 一 来 ,可 以 把 上 述 修改 vi :的 过 程 “插入 ”标号 过 程 . 当 标 号 过 程 停止 而 又 没有 找 
到 增 广 交错 路 径 时 , 转 和 人 对 w : 记 的 修改 ,加 入 获得 的 新 边 后 继续 标号 . 可 能 要 多 次 修改 w， 
Bi: 才能 找到 增 广 交 错 路 径 . 

如 果 直 接 用 式 (7. 20) 计 算 9. 工 作 量 为 O(n?), 太 大 了 . 为 了 节约 计算 9 的 工作 量 ,引入 
两 个 变量 ; 和 有 .对 每 一 个 Bi ,s(Bj) 二 min{ws 一 a; 一 B; | A; 已 标号 } ,h(B;) 是 使 s(B;) 取 到 
最 小 值 的 A;. 这 样 就 把 计算 9 的 工作 分 散在 标号 的 过 程 中 ,而 求 最 小 值 仅 需 On). 

在 下 述 算法 中 ,X 是 A 中 已 标号 的 顶点 集 .XX 是 A 中 已 标号 未 检查 的 顶点 集 ,Y 是 B 
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中 未 标号 的 顶点 集 . 


算法 7.8 匈牙利 算法 
输入 : 赋 权 完全 二 部 图 G= 一 A,B,E,uw> ,其 中 |A|=|1BI 王 7 


才 人 四 


输出 : match 

i for i=1 to n do match(Ai)¢0,a¢0 // 初 始 化 

1.1 forj=]1 ton do match(B, )< 0 emintws } 

六 for g=1 ton do // 进 行 个 阶段 ,每 个 阶段 增加 一 条 匹配 边 
-| JJ < 

莱 反 for j=1 ton do 

让 s(Bj)¢+w 

2.4 for i=1 ton do 

2.5 这 w 十 太一 ro then IJ HJU{(Ai,B;)} // 构 造 G(1J) 

入 XOXXD // 标 号 过 程 开始 

| for Ai eA Amatch(Ai)=0 do 

到 区 LAi)e0,XtXU{(A) .XX XXU{A} // 所 有 非 饱和 的 A; 标 号 为 0 且 未 检查 
4. 7<B 

4.1 while XX 2do 

4.2 任 取 AieXX,XX <4XX 一 {Ai)} 

4.3 for Bi ey do 

4.4 if 0<rw —ai—B <s(B;) then 

4.5 s(Bj) erws —a;—B sh(Bi) eA; 

4.6 if (Ai,B;) elJ then 

4.7 LCB))4Ai ,YY<4 了 一 {B)) 

4.8 if match(B) ) 一 0 then goto 6 // 存 在 增 广 交错 路 径 已 
4.9 Ai¢match(B,) ,LAB XXU{A), XX eXXU{A,} 
< 二 minf s(B) | Bey) // 修 改 ai,B 

Cb | for i=1 ton do 

5s2 if A;EeX then wkai 十 0 else wkai 一 0 

5. 3 for j=1 ton do 

5.4 if Bi ey then B «8B; 十 0 else BB;—0 

5.5 for Bi esy do 

5.6 s(Bi)<s(Bi) 一 20 

5.6 让 s(B)) 一 0 then 

叶 Aieh(B;), XX XXU{AY ,TI ATU{A,,B;)} // 加 入 新 边 
玉 力 goto 4.1 // 返 回 继续 标号 

6. Aidt (Bj) match(B;) eA; ,match(Ai)eB, // 回 溯 找 到 P,M <M EP 
6.1 if 1(Ai)#20 then Bjet (Ai) ,goto 6 // 否 则 g 的 这 一 阶段 结束 


定理 7.11 算法 7.8 得 到 的 M 是 最 小 权 完美 匹配 ,并 且 在 O(n ) 步 内 终止 计算 . 
证 每 一 个 阶段 增加 一 条 匹配 边 ,n 个 阶段 得 到 的 M 是 完美 匹配 . 计算 结束 时 ， 
ai(1 二 i 过) ,B(1 志 j 生 ) 是 式 (D) 的 可 行 解 , 其 目标 函数 值 为 Sa Sg. 对 应 匹配 
i=1 了 一 1 


M 的 zz (1 过 i 之 n,1 过 j 壹 nw) 是 式 (P) 的 可 行 解 ,其 目标 函数 值 为 2) wy = 2) (ww 十 


(MB)EM (AirB)EM 


B) = Dat DB a iH,BUZI NN Min, 1<Ii<n 人 分 别 是 
i=1 


yi 
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式 (D) 和 式 (P) 的 最 优 解 , 得 证 M 是 最 小 权 完美 匹配 . 

计算 总 共 进 行 n 个 阶段 . 在 每 一 个 阶段 中 .构造 GCIJ)(2.1 一 2.5) 的 工作 量 为 O(n?). 
至 多 有 nn 个 已 标号 未 检查 的 A;. 检 查 一 个 A;(4. 2 一 4.9) 的 工作 量 为 O(n) ,标号 的 总 工作 量 
为 0(02 ). 这 里 注意 ,对 于 那些 经 过 修改 对 偶 变量 重新 返回 的 A; ,是 已 进行 的 标号 过 程 的 继 
续 , 而 不 是 从 头 开始 检查 一 个 新 的 已 标号 未 检查 A; ,所 以 并 不 增加 已 标号 未 检查 的 A; 的 数 
量 . 每 次 修改 对 偶 变量 a;(1 志 i 二 1) ,Bj (1 二 j 志 nn) ,或 者 找到 一 条 增 广 交 错 路 径 ,或 者 至 少 使 
一 个 未 标号 的 Bj 获得 标号 ,因此 在 一 个 阶段 内 修改 对 偶 变量 的 次 数 不 超 过 n， 每 一 次 修改 
(5. 1 一 5.7) 的 工作 量 是 O(n) ,其 总 的 工作 量 为 O(02 ). 综 上 所 述 ,每 一 个 阶段 的 工作 量 
为 O(w?). 得 证 算法 的 时 间 复 杂 度 为 OG ). 

下 面 用 匈牙利 算法 解 例 7.6 中 的 赋 权 二 部 图 的 最 小 权 完美 匹配 问题 . 在 图 7. 16 每 个 
分 图 左 侧 的 表 中 4 行 分 别 是 A, 一 A, ,4 列 是 Bi 一 B, , 右 侧 图 中 左边 的 4 个 顶点 是 A, 一 A, ， 
右边 的 是 Bi 一 B. 等 于 ai 十 B; 的 ws 加 圆圈 . 初始 的 w ,B 及 二 部 图 如 图 7.16(1) 中 所 示 . 前 
两 个 阶段 顺利 地 得 到 匹配 边 (A,B:,) 和 (As: ,Bi ). 对 应 地 表 中 用 双 圈 . 在 第 3 阶段 ,A，， 
A4 得 到 标号 后 ,标号 过 程 终 止 , 转 去 修改 w:B. 当时 的 s 和 hh 列 在 图 7.16(1) 的 表 下 方 . 
0 一 0.5, 修 改 后 的 wi ,B 见 图 7. 16(2),* 表示 该 行 ( 列 ) 对 应 的 顶点 已 标号 . 加 入 边 (A; ,B: ) ， 
继续 标号 ,找到 增 广 交 错 路 径 A B: Ai B: , 见 图 7. 16(2). 得 到 M={(A,B:),(A:,B:)， 
(A;.,B1)), 见 图 7.16(3). 在 第 4 阶段 .As 得 到 标号 后 标号 过 程 终止 ,此 时 的 s 和 hh 列 于 


@O 0 :er 多 4 8 
9 DO.0 
*8 5840 me ?图 @，-05 man、 
Os@Oo 8@8 4 05 om 
4 sb [4] 
*96960 NS 上 人 四 人 me 
人 35453515 
s 5153 PB 3.5453.51.5 
hd 0Q) 
(0D) 
Ee 4 8B 2 4 8 
9 OO@ 9 -05 9 @@9 -1 
8038 4 05 8 人 84 0 [四 [A 
sO-05 DOO-I 闻 
*9696 05 ns +9@956 1 
Bp 3.54.53.51.5 p4542 
s 5154 s4 42 
h As .4 44 Aa h A 44 4 
(3) (4) 
只 4 8 
9 DO -2 4 8 
8s8@s@ 1 IJc Yeo 
D3 OO le” ot 
9@956 2 
B5453 i 
(5) 


图 7.16 
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图 7.16(3) 的 下 方 . 0 一 0. 5 ,修改 后 的 w :8 列 于 图 7. 16(4). 加 入 边 (A, ,B: ) ,继续 标号 ,如 
图 7.16(4) 中 所 示 . 没有 得 到 增 广 交 错 路 径 标号 过 程 就 又 终止 了 .再 次 转 和 修改,B. 此 时 
的 s 和 h 列 于 图 7.16(4) 的 下 方 . 0 一 1 .修改 后 的 wi ,B 见 图 7. 16(5). 加 入 边 (A: ,B4 ) 后 继续 
标号 ,找到 增 广 交 错 路 径 A, B, A, B, ,得 到 完美 匹配 M= {(Ai,B;),(A;,B,),(A;,Bi)，, 
(A4 ,Bs)) ,如 图 7.16(6) 所 示 . 计算 结束 .此 时 
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4 4 
a 2 2 十 1 一 2 十 2 十 5 十 4 十 5 十 3 二 16 
让 1 j=1 


2) ws =3+4+3+6=16 


(Ai'B)EM 
两 者 相等 , 即 为 最 优 值 . 说 明 : 在 第 4 阶段 第 二 次 修改 ai.B 后 ,wis#a1 十 B,G(IJ) 中 不 含 边 
(A1,B,). 但 是 否 剔除 这 条 边 并 不 影响 接 下 来 的 标号 , 故 算法 中 没有 这 个 剔除 操作 . 

关于 一 般 图 的 匹配 和 赋 权 图 的 匹配 也 有 OC ) 的 算法 ,但 算法 要 复杂 得 多 ,可 参阅 文 
献 [8]. 


习 题 7 


7.1 证 明 ;: v= >) /GD 一 > fa)). 


<j>EE <nj>EE 
7.2 图 7.17 给 定 容量 网 络 N= 二 V,E,c,s,t 这 和 可 行 流 / ,其 中 每 条 边 e 旁 的 第 1 个 数 是 
cle) ,第 2 个 数 是 fo(e)， 以 fo 为 初始 可 行 流 ,用 FF 算法 求 N 的 最 大 流 fx 和 最 小 制 
集 (X,V 一 X) ,并 验证 v(f5x)= 二 c(X,V 一 X). 


图 7.17 


用 Dinic 算法 求 习题 7.2 中 的 容量 网 络 N 的 最 大 流 , 仍 以 fo 为 初始 可 行 流 . 

设 N 是 简单 容量 网 络 .f 是 N 上 的 0-1 可 行 流 ,证 明 N(/) 也 是 简单 容量 网 络 . 

设计 一 个 算法 求 容量 网 络 中 给 定 流 量 的 可 行 流 . 

将 求 多 发 点 ,多 收 点 的 容量 网 络 的 最 大 流 问 题 转化 为 标准 的 最 大 流 问 题 . 

将 求 带 顶 点 容量 的 容量 网 络 的 最 大 流 问 题 转化 为 标准 的 最 大 流 问 题 . 带 顶 点 容量 

的 容量 网 络 N = 二 二 V,E,c,s,t 放 ,其 中 c:EU (V 一 1{s,t}) 3R* , 即 不 但 每 一 条 边 

e 有 容量 限制 c(e) ,而且 对 通过 每 个 中 间 点 的 流量 也 有 限制 : Vu ev 一 {s,}， 
> f (vu) < clw). 


<vu>EE 


7.8 设 N==<V,E,c,s,t 这 具有 单位 容量 ,1V|==n,1E| 二 m,NN 的 最 大 流量 为 v*. 证 明 : 


A 
加 w 
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7. 和 9 


7.10 


(1) N 中 s- 距离 小 于 等 于 2n/ Vv*. 

(2) 对 N 运用 Dinic 算法 的 运行 时 间 为 O(n**m) (提示: 参照 定理 7. 4 的 证 明 ). 

设 有 向 图 D= 二 V,E>>,s:t eV ,把 求 从 > 到 :上 尽 可 能 多 的 边 不 相交 的 路 径 问题 转化 为 

最 大 流 问题 ,分 别 用 FF 算法 和 Dinic 算法 解 最 大 流 问 题 并 分 析 算法 的 时 间 复 杂 度 . 
设 有 向 图 D= 二 V.E> ,st eV .把 求 从 ;到 1 尽 可 能 多 的 顶点 ( 除 ;,t 外) 不 相交 的 路 
径 问 题 转化 为 最 大 流 问 题 , 分 别 用 FF 算法 和 Dinic 算法 解 最 大 流 问题 并 分 析 算 法 的 
时 间 复 杂 度 . 
用 Floyd 算法 检测 图 7. 18 中 两 个 赋 权 有 向 图 是 否 有 负 回 路 . 当 无 负 回 路 时 ,输出 图 
中 任意 两 点 之 间 的 最 短路 径 及 其 距离 ; 当 有 负 回 路 时 ,输出 一 条 负 回 路 . 


设 赋 权 有 向 图 DD= 二 V .,E,w 记 无 负 回 路 ,n= 二 IV|1.d* (让 为 DD 中 wv 到 wi 边 数 不 超 过 

& 的 最 短路 径 的 权 ,2i<n,k 宇 1. 

(1) 给 出 ge (i) 的 递 推 公式 . 

(2) 利用 da (让 的 递 推 公 式 设计 一 个 算法 , 求 D 中 wi 到 其 他 各 点 的 最 短路 径 , 并 分 
析 算 法 的 运行 时 间 . 

用 在 习题 7. 12 中 设计 的 算法 计算 图 7.18(a) 中 到 其 他 各 点 的 最 短路 径 . 

( 例 7.4 的 继续 ) 容 量 -费用 网 络 N 及 流量 vo 二 8 的 可 行 流 fo。 如 图 7. 19 所 示 , 其 中 每 

一 条 边 旁 边 的 两 个 数 依次 是 容量 和 费用 . 以 fo 为 

初始 可 行 流 用 负 回 路 算法 , 求 N 的 流量 wv 二 8 的 

最 小 费用 流 . 

用 最 短路 径 算法 求 图 7. 19 中 容量 -费用 网 络 N 

的 流量 we=8 的 最 小 费用 流 ( 不 使 用 图 7. 19 中 

的 /0). 

设 容量 网 络 N= 二 二 V,E,c,s,t 这 ,证 明 : 存在 最 大 

流 三 使 得 ,对 于 所 有 进入 s 的 边 和 离开 1 的 边 e， 

Ce) 一 0( 因 此 ,可 以 删 去 N 中 所 有 进入 s 的 边 和 

离开 t 的 边 . 也 就 是 说 ,可 以 假设 * 的 入 度 和 + 的 出 度 为 0). 

给 定 容量 -费用 网 络 ,如 何 求 下 述 最 大 流 : 

(1) 最 小 费用 最 大 流 . 


网 络 流 算法 


(2) 费用 不 超过 给 定 值 的 最 大 流 . 
7.18 某 公司 有 3 个 工厂 .4 个 销售 中 心 ,各 厂 的 产量 、 销 售 中 心 的 销量 以 及 它们 之 间 的 单 
位 运费 如 表 7.6 所 示 . 试制 订 调运 方案 使 得 总 运费 最 小 . 
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表 7.6 
销售 中 心 销售 中 心 [[ 销售 中 心 亚 销售 中 心 W 产量 w 
工厂 A 3 2 7 6 5 
东 矿 专 7 5 3 6 
5 2 5 4 5 2.5 
销量 性 6 4 2 要 这 13.5 


7.19 某 公司 有 3 个 生产 基地 、4 个 用 户 , 基 地 的 产量 、 用 户 的 需求 量 以 及 基地 到 用 户 的 单 
位 运费 如 表 7.7 所 示 . 试制 订 调 运 方 案 使 得 总 运费 最 小 . 


表 7.7 
用 户 B 用 户 B。 用 户 Bs 用 户 B， 产量 a 
基地 A 3 座 3 4 8 
基地 A。 11 到 5 9 5 
基地 As 6 7 1 5 9 
需求 量 狂 4 3 5 6 广 a2 
7.20 某 公司 有 2 个 工厂 .2 个 仓库 和 4 个 销售 点 . 工厂 生产 的 产品 均 运 往 仓 库 , 销 售 点 从 


仓库 提货 . 假设 仓库 足够 大 .对 存放 的 数量 不 构成 限制 , 图 7. 20 给 出 产品 的 转运 关 
系 , 边 旁 的 数 是 单位 运费 . 试制 订 调运 方案 使 得 总 运费 最 小 . 
销售 点 ”销量 


ED 


7.21 某 企 业 和 用 户 签订 了 为 期 一 年 的 合同 ,合同 规定 每 季度 末 交 货 . 表 7. 8 列 出 企业 每 季 
度 的 生产 能 力 、 交 货 量 以 及 生产 成 本 . 每 台 设备 每 季度 的 库存 费 0. 1 万 元 . 试制 订 生 产 
计划 使 得 总 成 本 最 低 . 
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7.22 


7.23 


7.24 


7.25 


7.26 


Ya 


7.28 


表 7.8 
季 度 生产 能 力 / 台 交 货 量 / 台 生产 成 本 /( 万 元 / 台 ) 
1 怠 15 12.0 
区 35 20 1 
3 30 25 11.5 
4 20 20 12.5 


(1) 写 出 问题 的 最 小 费用 流 模型 
(2) 写 出 问题 的 运输 问题 模型 并 求解 

某 社区 有 5 个 工作 岗位 ,每 个 岗位 需要 一 个 人 . 现 接 到 5 位 待业 者 的 申请 ,A 申请 岗 
位 1.2 或 3,B 申请 岗位 1 或 4,C 和 D 申 请 岗位 4 或 5,E 申 请 岗位 5. 如 何 安排 才能 
使 尽 可 能 多 的 申请 者 就 业 ? 

赋 权 完全 二 部 图 的 权 函 数 由 图 7. 21 所 示 的 矩阵 给 出 ,求解 这 个 指派 问题 ， 


2 Wo 避 o 


2 
1 
3 
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图 7:21 


有 5 项 工程 由 3 家 建筑 公司 承建 建筑 公司 呈报 的 工程 造价 ( 千 万 元 ) 如 表 7.9 所 
示 . 每 家 建筑 公司 最 多 承建 2 项 工程 . 如 何 安排 才能 使 总 造价 最 小 ? 


表 7.9 


工程 B 工程 B。 工程 B 工程 B 工程 Bs 
公司 Ai 10 启 9 8 10 
公司 As 9 18 6 10 8 
公司 As 6 14 8 8 6 


如 果 在 算法 7. 8( 二 部 图 最 小 权 完美 匹配 的 匈牙利 算法 ) 中 直接 使 用 公式 (7. 20) 计 算 
90, 对 算法 的 时 间 复 杂 度 有 什么 影响 ? 

设 二 部 图 G= 二 A,B,E 放 ,函数 5b: AUB -V1+ ,M ,其 中 Zt+ 是 正 整 数 集 ， 如 果 
Vv eA UB,v 恰 好 与 M 中 的 5(v) 条 边关 联 . 则 称 M 是 G 的 b- 匹 配 . -匹配 问题 就 是 
给 定 二 部 图 G== 二 A,B,E 二 > 和 函数 5:AUB -2+ , 求 G 的 0 匹配 . 试 设计 一 个 
-匹配 问题 的 算法 并 分 析 算 法 的 时 间 复 杂 度 . 

二 部 图 的 瓶颈 匹配 问题 : 给 定 赋 权 二 部 图 G= 一 A,B,E,zw>:, 求 G 的 最 大 权 最 小 的 
完美 匹配 M . 即 求 完 美 匹配 M 是 使 得 max{w(e) | e eM}) 最 小 . 设计 一 个 二 部 图 瓶颈 
匹配 问题 的 算法 并 分 析 算 法 的 时 间 复 杂 度 . 

设 无 向 图 G 一 和 二 V,E>> ,Vs 如 果 每 一 条 边 都 有 一 个 端点 属于 六 , 则 称 六 是 一 个 
顶点 覆盖 . 顶点 数 最 少 的 顶点 覆盖 称 作 最 小 顶点 覆盖 . 


网 络 流 算法 


(1) 设 二 部 图 G 二 二 A,B,E,M gf 是 一 个 匹配 ,V cA UB 是 一 个 顶点 覆盖 . 证 明 : 
IMI<IVv|. 

(2) 设 二 部 图 G 王 一 A,B,E>,M 是 最 大 匹配 ,用 匈牙利 算法 计算 中 ,A 中 未 标号 的 
顶点 集 为 A1,B 中 已 标号 的 顶点 集 为 Bi,V=A UB,. 证 明 : V 是 一 个 顶点 覆盖 
且 IVI=|MIl. 

(3) 设计 一 个 求 二 部 图 最 小 顶点 覆盖 的 算法 . 
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多 本 
算法 分 析 与 问题 的 计算 复杂 度 


前 面 几 章 介绍 了 顺序 算法 的 设计 技术 ,本章 开始 介绍 顺序 算法 的 分 析 技 术 . 

对 于 给 定 的 问题 ,可 能 有 多 种 算法 . 比如 个 元 素 的 排序 问题 , 快 排序 算法 在 最 坏 情 况 
下 的 时 间 复 杂 度 是 OCm?) ,归并 排序 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 是 O(nlogn) ,显然 归 
并 排序 是 比较 好 的 算法 . 现在 关心 的 是 : 是 否 存 在 比 归并 排序 更 好 的 算法 ? 在 排序 问题 的 
所 有 算法 中 (包括 已 知 的 和 未 知 的 ) ,最 好 的 排序 算法 是 什么 ? 它 的 时 间 复 杂 度 是 多 少 ? 

以 时 间 复 杂 度 为 例 ,对 于 一 个 问题 来 说 ,求解 的 算法 (包含 尚未 提出 的 算法 在 内 ) 很 多 ， 
每 个 算法 的 时 间 复 杂 度 也 不 一 样 . 算法 的 效率 越 高 ,占用 的 时 间 就 越 少 . 问题 的 计算 复杂 度 
就 是 求解 这 个 问题 所 需要 的 最 少 工 作 量 , 它 是 由 问题 本 身 结 构 决 定 的 内 在 性 质 , 与 求解 它 的 
算法 好 坏 无 关 . 求解 一 个 问题 的 最 好 算法 , 它 的 时 间 复 杂 度 函数 应 该 恰好 等 于 问题 的 计算 复 
杂 度 . 相反 ,一 个 不 好 的 算法 在 执行 中 包含 了 大 量 的 宛 余 工作 ,时 间 复 杂 度 函数 比 问题 的 计 
算 复 杂 度 可 能 高 很 多 . 最 优 的 算法 是 指 求解 该 问题 的 效率 最 高 的 算法 , 即 该 算法 的 时 间 复 杂 
度 函 数 恰好 与 问题 的 计算 复杂 度 相 等 ,至 少 在 阶 上 相等 . 因此 ,确认 问题 的 计算 复杂 度 与 找 
到 求解 该 问题 的 最 优 算法 有 着 密切 的 关系 . 

可 以 从 求解 某 个 问题 的 算法 出 发 来 帮助 确定 问题 的 计算 复杂 度 . 对 于 给 定 的 问题 ,算法 
的 时 间 复 杂 度 相当 于 问题 的 计算 复杂 度 的 一 个 上 界 . 给 出 一 个 算法 ,就 得 到 一 个 上 界 . 随 着 
算法 的 不 断 改进 ,这 个 上 界 不 断 降低 ,直到 盘 近 问题 的 计算 复杂 度 琴 数 ， 

怎样 确认 这 个 上 界 已 经 降 到 与 问题 的 计算 复杂 度 相等 呢 ? 这 需要 另 一 个 方向 的 工作 ， 
即 确认 要 得 到 正确 的 解 算法 所 必须 完成 的 工作 量 的 下 界 . 换 句 话说 ,如 果 某 个 算法 做 的 工作 
量 小 于 这 个 值 ,那么 一 定 存在 某 个 输入 实例 ,使 得 该 算法 得 到 的 解 是 错 的 . 为 了 得 到 这 个 下 
界 , 通 常 需要 分 析 问 题 的 固有 性 质 . 比如 给 出 针对 任意 求解 算法 设计 “最 坏 ” 实 例 的 方法 ,对 
于 这 种 实例 统计 该 算法 至 少 要 做 多 少 工作 ,以 这 个 工作 量 作为 问题 计算 复杂 度 的 一 个 下 界 . 
还 可 以 对 求解 这 个 问题 的 所 有 算法 建立 执行 过 程 的 统一 模型 (如 决策 树 等 ), 从 而 对 最 坏 情 
况 或 平均 情况 下 的 工作 量 给 出 估计 ,以 这 个 估计 作为 问题 计算 复杂 度 的 下 界 . 当然 ,分 析 方 
法 不 同 , 所 得 到 的 下 界 可 能 是 不 一 样 的 . 通过 不 断 改进 数学 方法 ,使 得 下 界 不 断 提升 ,直到 到 
近 问 题 的 计算 复杂 度 函 数 . 在 实践 中 上 界 与 下 界 的 改进 是 同时 进行 的 , 当 上 界 与 下 界 的 值 相 
等 或 它们 的 阶 相等 ,这 时 得 到 的 就 是 问题 的 计算 复杂 度 . 

考虑 求解 一 个 问题 的 所 有 算法 .要 比较 其 中 不 同 算法 的 运行 时 间 , 就 要 有 一 个 统一 的 
“时 间 ” 标 准 . 正如 在 1. 1 节 所 提 到 的 ,需要 规定 一 个 基本 运算 .每 个 算法 的 执行 时 间 就 是 该 
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算法 所 做 的 基本 运算 次 数 . 给 定 问题 和 基本 运算 之 后 就 确定 了 一 个 算法 类 . 比如 排序 问题 
基本 运算 规定 为 A 中 元 素 之 间 的 比较 运算 . 基数 排序 算法 就 不 属于 这 个 算法 类 ,因为 它 的 
基本 运算 不 是 元 素 间 的 比较 . 下 面 讨论 的 时 间 复 杂 度 都 是 在 指定 基本 运算 的 算法 类 中 来 考 
虑 的 . 

正如 上 面 所 述 ,确定 算法 类 的 时 间 复 杂 度 通常 是 上 .下 界 通 近 的 方法 ,以 最 坏 情 况 下 的 
时 间 复 杂 度 分 析 为 例 , 主 要 步骤 是 : 

(1) 设计 一 个 算法 A ,名 tt A 在 最 坏 情况 下 的 时 间 复 杂 度 W(n) ,从 而 得 到 了 算法 类 在 
最 坏 情 况 下 的 时 间 复 杂 度 的 一 个 上 界 . 

(2) 寻找 函数 ey i n 的 输入 并 且 该 算法 在 这 个 输 
入 下 至 少 要 做 下 (mn) 次 基本 运算 , 即 找到 该 问题 的 算法 类 在 最 坏 情况 下 时 间 复 杂 性 的 一 个 
下 界 . 

(3) 如 果 W()= 二 FO) 或 WW(n) 二 (FF(n)), 那 么 FF(n) 就 是 该 算法 类 最 坏 情况 下 的 时 
间 复 杂 度 的 下 界 . 而 算法 A 就 是 求解 该 问题 的 算法 类 中 的 最 优 算法 . 此 时 称 此 下 界 是 紧 的 
(tight). 

(4) 如 果 Wn) 二 F(n) ,可 能 A 不 是 最 优 算法 或 者 下 (n) 这 个 下 界 过 低 . 

QO@ 改进 A 或 设计 新 算法 A' 使 得 W' (nn) 二 W (1); 

@ 找 出 更 高 的 新 下 界 F'(n) 使 得 F'(n) 记 Fn). 

(5) 重复 步骤 (4) ,最 终 得 到 Wi (n) 二 FF (nn) 或 者 W’(n) 二 BQ(F'(n)) 为 止 . 

平均 情况 下 的 时 间 复 杂 度 的 下 界 与 最 坏 情况 下 的 处 理 方 法 类 似 . 

遗憾 的 是 ,对 大 量 的 实际 问题 ,上 述 处 理 过 程 中 函数 W(n) 的 阶 往往 高 于 下 (n) 的 阶 ,这 
两 个 函数 的 阶 之 间 存 在 某 个 “ 间 际 ”, 或 者 还 没有 找到 好 的 算法 ,或 者 F(n) 不 是 一 个 紧 的 下 
界 . 实践 中 确认 间 题 的 计算 复杂 度 是 一 件 十 分 困难 的 事情 . 因为 一 方面 要 设计 高 效 算法 , 另 
一 方面 ,也 是 更 困难 的 方面 ,要 给 出 一 个 下 界 , 并 证 明 所 有 算法 包括 尚未 设计 出 来 的 算法 在 
内 ;其 时 间 复 杂 度 都 不 小 于 该 下 界 . 至 今 只 有 少量 问题 能 够 确认 其 计算 复杂 度 . 本 章 先 定义 
简单 的 下 界 平凡 下 界 ,讨论 几 个 简单 问题 的 计算 复杂 度 的 下 界 ,然后 定义 一 种 常用 于 下 
界 讨论 的 信息 论 模型 一 一 决策 树 , 最 后 给 出 几 个 典型 问题 的 下 界 界定 方法 和 最 优 算法 . 

记 最 坏 情况 的 时 间 复 杂 性 函数 为 W(n) ,平均 情况 的 时 间 复 杂 性 函数 为 A(n). 


8.1 平凡 下 界 


有 的 问题 必须 扫描 完 所 有 输入 才能 得 到 解 , 这 就 给 出 了 一 个 求 下界 的 简单 办 法 ,就 是 对 
输入 进行 计数 . 另 一 个 简单 办 法 是 对 输出 ae ee 
结束 . 

例 8.1 写 出 所 有 nn 阶 置换 问题 的 下 界 是 1. 

证 7 阶 置换 共有 ?21 个, 全部“ 写 ? 出 最 少 需要 Qn1) 时 间 . 

例 8.2 求 半 次 实 系数 多 项 式 在 某 个 实数 处 的 值 的 下 界 是 Q (0z). 

证 要 计算 出 次 实 系数 多 项 式 在 某 个 实数 处 的 值 .可 以 考虑 以 数 的 乘法 作为 基本 运 
算 .由 于 不 同 的 系数 导致 的 求 值 结果 是 不 一 样 的 ,多项式 的 每 个 系数 都 必须 参与 乘法 运算 . 
于 是 乘法 运算 次 数 不 少 于 输入 系数 的 个 数 , 全 部 系数 有 nn 个 ,因此 Q(n) 是 算法 类 时 间 复 杂 


击 吕 中 
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度 的 一 个 下 界 . 

例 8.3 求 两 个 nxn 和 矩阵 乘积 的 下 界 是 n?. 

证 该 算法 类 的 基本 运算 是 元 素 相 乘 . 输出 矩阵 中 有 n? 个 元 素 , 每 个 元 素 都 需要 通过 
至 少 1 次 乘法 才能 得 到 ,因此 Q(x ) 是 矩阵 乘法 问题 的 一 个 下 界 . 现在 还 不 知道 这 个 下 界 是 
不 是 紧 的 . 

例 8.4 货 郎 问题 的 一 个 下 界 是 Q(x ). 

通常 平凡 下 界 太 低 ,没有 什么 实际 价值 ,需要 提高 平凡 下 界 得 到 更 有 用 的 下 界 . 


8.2 直接 计数 求解 该 问题 所 需要 的 最 少 运算 


对 于 一 些 比较 简单 的 问题 ,可 以 直接 计数 求解 该 问题 必须 要 做 的 基本 运算 次 数 来 得 到 
下 界 . 请 看 下 面 的 例子 . 

例 8.5 找 最 大 问题 : 在 个 不 同 的 数 中 找 最 大 的 数 , 基 本 运算 是 元 素 比较 , 算 法 2.7 
给 出 了 一 个 顺序 比较 算法 . 该 算法 的 最 坏 情 况 的 时 间 复 杂 度 为 W(n) 二 n 一 1. 该 算法 给 出 了 
“ 找 最 大 ”问题 计算 复杂 度 的 一 个 上 界 . 

下 界 ”在 个 数 的 数组 中 找 最 大 的 数 , 以 比较 做 基本 运算 的 算法 类 中 的 任何 算法 的 最 
坏 情 况 下 至 少 要 做 n 一 1 次 比较 . 

证 ”因为 最 大 数 是 唯一 的 ,其 他 的 "一 1 个 数 必须 在 比较 后 被 淘汰 . 1 次 比较 至 多 淘汰 
1 个 数 , 所 以 至 少 需要 "一 1 次 比较 . 

根据 上 面 的 分 析 , 任 何 找 最 大 的 算法 对 于 规模 为 n 的 输入 至 少 要 做 一 1 次 比较 ,这 是 
找 最 大 问题 在 最 坏 情 况 下 的 时 间 复 杂 度 的 一 个 下 界 . 上 界 与 下 界 正好 相等 ,因此 该 算法 类 在 
最 坏 情 况 下 的 时 间 复 杂 度 的 最 大 下 界 就 是 一 1, 它 反映 了 找 最 大 问题 本 身 的 计算 复杂 度 . 
同时 这 也 证 明了 Findmax 算法 是 该 算法 类 中 时 间 上 最 优 的 算法 . 

结论 Findmax 算法 是 “ 找 最 大 ”问题 的 最 优 算法 . 

例 8.6 ee 给 定 由 个 正 整数 A[1],A[2],…,A[nj 组 成 的 数组 
A., 想 输出 一 个 二 维 的 nXn 的 数组 B, 其 中 B[i,j](i 志 站 等 于 项 A[ 门 到 A[ 门 的 和 , 即 
A[Li eh -十 A[ 站 ]. 车 i>j, 则 B[i,j]=0. 以 A err 算 , 对 任 
何 计算 二 维 数组 B 的 算法 ,在 最 坏 情况 下 至 少 需要 多 少 次 加 法 ? 证 明 你 的 结 

解 ”考虑 下 述 数组 SR 

A[ 可 之 AL 十 … 十 AD 一 本 = B[1,i 一 1] 

下 面 仅 考虑 i<j 的 情况 . 易 见 如 果 坟 二 is ,那么 对 任意 7E 11,2,…,2} 有 了 Li , 门 过 
Ba ,让 . 换 句 话说 ,在 数组 B 的 同一 列 , 数 从 上 到 下 越 来 越 小 . 其 次 ,对 于 不 同 列 的 元 素 
B[i,j] 和 B[k, 候 ,如 果 /二 j ,那么 不 管 i 和 k& 取 什么 值 ,都 有 BLk, 候 二 BL[i,j]. 这 是 因为 

B[k,l] > A[LL] > B[L1,l—1] > B[i,;] 

考虑 数组 B 中 的 非 0 元素 . 在 这 些 元 素 中 ,处 于 主 对 角 线 位 置 的 元 素 B[i, 让 二 A[ 门 ,不 
需要 做 加 法 ,这 样 的 元 素 有 个 . 除 此 之 外 .其 他 元 素 都 需要 通过 加 法 运算 得 到 . 根据 上 面 的 
分 析 , 这 些 元 素 的 值 彼此 不 等 .这 意味 着 做 1 次 加 法 不 可 能 得 到 2 个 或 者 更 多 的 值 . 因此 加 
法 次 数 至 少 等 于 这 些 元 素 的 个 数 , 即 n(n 一 1)/2. 

不 难看 出 这 是 一 个 紧 的 下 界 , 因 为 下 述 算法 Sum 恰好 做 了 n(n 一 1)/2 加 法 ,也 可 以 说 
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算法 Sum 是 该 算法 类 中 最 坏 情 况 下 最 优 的 算法 . 
算法 8.1 Sum 
输入 : 数组 A 
输出 : 二 维 数组 B 
1. fori<-l] ton do 
2. BC, 说 < 一 Ar 
3. fori<-1 ton—l1 do 
4. forj<itl ton do 
5 B[i,j]<B[Li,j—1]+AL[;] 


8.3 决 策 树 


决策 树 是 一 个 十 分 有 效 的 分 析 问 题 计算 复杂 度 下 界 的 工具 ,特别 适合 分 析 诸 如 搜索 问 
题 .排序 问题 等 以 比较 作为 基本 运算 的 问题 . 

决策 树 是 一 棵 二 叉 树 ,每 个 内 结 点 代表 一 次 运算 (如 一 次 比较 ), 叶 结 点 代表 一 个 输出 
(有 的 问题 对 于 某 些 实例 的 输出 可 能 在 内 结 点 ). 任何 算法 要 得 到 这 个 输出 必须 完成 由 根 结 
点 到 该 叶 结 点 所 在 路 径 的 所 有 运算 ,计算 的 工作 量 恰好 等 于 路 径 上 的 结 点 个 数 . 如 果 叶 结 点 
是 所 有 的 输出 , 则 该 问题 的 计算 复杂 度 的 下 界 不 低 于 决策 树 的 深度 . 下 面 讨论 二 又 树 的 结 点 
个 数 . 叶 结 点 个 数 与 树 的 深度 之 间 的 关系 ,相关 结果 将 在 后 面 关 于 计算 复杂 度 下 界 的 讨论 中 
用 到 . 

命题 8.1 在 二 叉 树 的 1 层 至 多 有 2: 个 结 点 ( 根 为 0 层 ). 

证 对 /上 用 归纳 法 . 

t 一 0, 树 有 1 个 结 点 ( 根 ) ,2" 一 1. 

假设 1 层 有 2: 个 结 点 , 则 :十 1 层 至 多 有 2 。 2: 个 结 点 , 即 2+! 个 结 点 . 

命题 8.2 深度 为 d 的 二 又 树 至 多 有 2+! 一 1 个 结 点 . 

证 对 d 用 归纳 法 . 

d= 二 0, 树 有 1 个 结 点 ( 根 ) ,而 2 一 1 一 1. 

假设 深度 为 d 的 二 叉 树 至 多 有 2 和 :一 1 个 结 点 ,考虑 一 棵 深度 为 4 十 1 的 二 又 树 . 由 命 
题 8. 1 ,在 第 d 十 1 层 至 多 有 2 … 个 结 点 , 故 深 度 为 &d 十 1 的 二 又 树 至 多 有 

24H 1 款 24+H1 Ce 242 业 


个 结 点 ， 

命题 8.3 nn 个 结 点 的 二 又 树 的 深度 至 少 为 [logn1 

证 假若 个 结 点 的 二 又 树 的 深度 至 多 为 llogn | 一 1. 则 由 命题 8. 2 得 知 : 该 树 的 结 点 
数 至 多 为 


2iom tl] =2m— 12m 1=n—l 
命题 8.4 设 1 为 二 又 树 中 的 树叶 个 数 ,d 为 树 深 ,如 果树 的 每 个 内 结 点 都 有 两 个 儿子 ， 
则 :上 委 2?4. 
证 ”对 深度 4d 归纳 . 
d= 二 0, 树 只 有 1 片 树叶 ,1 二 1, 而 深度 4 为 0. 命 题 为 真 . 


二 0 吕 器 
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假设 对 一 切 深度 小 于 4 的 二 又 树 命题 为 真 , 设 工 是 一 棵 深度 为 a 的 树 , 树 叶 数 为 +. 如 
图 8.1 所 示 , 取 走 T 的 d 层 的 z 片 树叶 ,得 到 树 T'. 容易 看 到 ,原来 在 TT 树 d 一 1 层 的 x/2 
个 内 结 点 成 了 T' 中 的 树叶 . T' 树 的 深度 为 4 一 1. 设 区 的 树叶 数 为 1 ,那么 有 

t= (tz)+7r/2=t— 7/2 
f-xtx/2 个 
> 
tx 个 
x 个 起 7 


图 8.1 从 工 中 取 走 所 有 树叶 得 到 T 


根据 归纳 假设 ,三 树 中 的 树叶 数 志 至 多 是 2471. 再 根据 命题 8. 1,d 层 至 多 有 x 三 2 个 结 点 ， 
于 是 


上 一 才 十 z/2 委 24 十 241 一 24 


8.4 检索 算法 的 时 间 复 杂 度 分 析 


检索 问题 : 对 于 按 非 递 减 顺序 排列 的 数组 L( 其 项 数 n 三 1) 和 数 z, 如 果 xz 在 L 中 ,输出 
并 在 志 中 出 现 的 下 标 ;否则 输出 为 0. 

基本 运算 : 数 的 比较 . 

在 前 面 的 章节 中 已 经 讨论 过 求解 该 问题 的 三 种 算法 : 顺序 检索 (1. 1 节 )、 改 进 的 顺序 
检索 (算法 1. 2) 和 二 分 检索 (算法 2. 1) ,并 给 出 了 前 两 种 算法 在 最 坏 与 平均 情况 下 的 时 间 复 
杂 度 . 

再 考虑 二 分 检索 算法 ,在 最 坏 情况 下 的 比较 次 数 W(n) 满 足 如 下 递 推 方程 : 
WO0) =1+W(n/2), n>1 
W(1)=1 
定理 8.1 W(n)=llognJ+1，n 宇 1 
证 对 nn 归纳 证 明 . 
n= 二 1 时 , 左 =W(1)=1, 右 =llogl 儿 1=1. 
假设 对 一 切 k,1 三 k 二 n, 命 题 为 真 , 则 


wco=1+w(| 二 | 1+|1og| +1 


加 LUogz 片 1 n 为 偶数 
本 Ne toil n 为 奇数 
一 llognz 片 1 


为 了 简单 起 见 ,不 妨 假设 n= 二 2 一 1. 要 计算 算法 在 平均 情况 下 的 时 间 复 杂 度 ,需要 给 出 
一 个 概率 分 布 . x 可 能 是 二 中 的 某 个 元 素 , 有 种 可 能 . x 也 可 能 不 是 中 的 元 素 . 如 果 
[让 过 x 二 L[i 十 1], 可 以 看 作 zz 处 在 L 的 第 i 个 “空隙 ”, 其 中 i 二 1,2,…,n 一 1. 此 外 ,zx 有 可 
能 小 于 L[1], 记 作 第 0 个 空 阶 ;zx 也 可 能 大 于 工 [四 , 记 作 和 第) 个 空隙 ,总 计 2 十 1 个 空隙 .对 
于 规模 为 n 的 输入 L 和 xz.z 的 值 可 能 在 L 中 的 某 个 位 置 ,也 可 能 落 入 某 个 空隙 . 根据 xz 的 


章法 分 新 与 问题 的 计算 复杂 度 


值 的 分 布 可 以 把 所 有 的 输入 分 成 2n 十 1 种 .我 们 假设 这 2n 十 1 种 输入 发 生 的 概率 都 相等 , 即 
都 等 于 1/(2n 十 1) ,那么 平均 比较 次 数 是 


大 
二 1 e000 是 一 1 
4(D) 一 元 下 TI(1S: 十 2S: 十 … 十 AS wi[2 HACz 十 1)] 
1 [一 D2 十 1 十 ACz 十 1)] 
22 十 1 
RE 一 1 1 1 
sr 2 k 3 Llogn 片 2 


其 中 S; 表示 使 得 算法 进行 i 次 比较 后 停止 计算 的 输入 种 数 . 显然 S 二 1, 恰 好 对 应 于 xz 等 于 
二 的 中 位 数 的 情况 . S; 二 2, 恰 好 对 应 于 zx 处 在 数组 长 度 的 1/4 和 3/4 位 置 的 情况 . 比如 二 
7, 那 么 当 xz==L[4] 时 算法 只 需要 1 次 比较 ,而 当 z=L[2] 或 L[6] 时 算法 需要 2 次 比较 ,2 和 
6 恰好 是 两 个 ln/2 其 模子 问 题 的 中 位 数 的 位 置 . 子 问题 规模 减 半 ,种 数 恰好 加 倍 ,因此 S, = 
2 .而 当 z 落 入 某 个 空隙 时 都 要 比较 A 次 ,共有 nn 十 1 种 可 能 . 对 算法 在 每 种 输入 下 做 的 比 
较 次 数 进行 概率 求 和 ,就 得 到 平均 情况 下 的 时 间 复 杂 度 . 

对 于 检索 问题 ,如 果 以 x 与 中 的 元 素 的 比较 作为 基本 运算 ,二 分 检索 算法 的 分 析 结 
果 给 出 了 该 算法 类 时 间 复 杂 度 的 一 个 上 界 . 换 句 话说 ,求解 这 类 问题 效率 最 高 的 算法 在 最 
坏 情 况 下 所 做 的 工作 量 不 会 超过 llog 片 1. 

一 个 问题 是 : 有 没有 更 好 的 算法 ? 或 者 说 是 否 能 够 做 更 少 的 工作 就 得 到 问题 的 解 ? 下 面 
通过 决策 树 的 模型 证 明 二 分 检索 算法 是 该 算法 类 中 最 优 的 算法 . 先 给 出 决策 树 的 构造 方法 . 

构造 方法 一 ” 设 A 是 一 个 检索 算法 ,对 于 给 定 规模 为 的 输入 实例 ,A 的 一 棵 决策 树 
是 一 棵 二 又 树 ,其 结 点 被 标记 为 1,2,….n, 且 标记 规则 如 下 : 

(1) 根据 算法 A, 如 果 工 第 一 次 与 志 [ 可 比较 ,将 树 根 标记 为 i; 

(2) 假设 某 结 点 被 标记 为 i, 分 下 述 情 况 处 理 : 

@ 当 xz<L() 时 ,算法 A 下 一 步 与 x 比较 的 是 L[ 站 ,那么 i 的 左 儿子 标记 为 j ;如 算法 
在 这 次 比较 后 停止 ,i 没有 左 儿 子 . 

@ 当 z>L(i) 时 ,算法 A 下 一 步 与 x 比较 的 是 L[k], 那 么 i 的 右 儿 子 标记 为 k; 如 算法 
在 这 次 比较 后 停止 ,i 没有 右 儿子 . 

@ 当 z==L[i 让 时 ,算法 停止 ,i 没有 儿子 . 

顺序 检索 算法 是 把 zx 依次 与 L[1],L[2],…,L[n] 比 较 . 如 果 z 一 工 [让 ,算法 将 在 这 次 
比较 后 停止 ,输出 i. 如 果 zx 二 [ 门 ,算法 下 一 步 将 把 x 与 L[i 二 1] 进行 比 较 .车 x<L[ 门 ,那么 
满足 L[i 一 1] 达 x<L[ 让 , 据 此 可 以 判定 xz 不 在 L 之 中 ,于 是 算法 停止 ,输出 0. 图 8. 2 和 
图 8. 3 分 别 是 输入 规模 "一 15 时 对 应 于 顺序 检索 算法 和 二 分 检索 算法 的 决策 树 . 

1 


\ 
、_14 


15 


IT 
图 8.2 顺序 检索 算法 的 决策 树 图 8.3 二 分 检索 算法 的 决策 树 
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给 定 规模 为 n 的 输入 L 和 zz, 算法 A 将 从 这 棵 具有 nn 个 结 点 的 决策 树 的 树 根 开 始 , 沿 

一 条 路 径 前 进 , 直 到 某 个 结 点 为 止 . 所 执行 的 基本 运算 次 数 是 这 条 路 径 的 结 点 个 数 . 最 坏 情 
况 下 的 基本 运算 次 数 是 树 的 深度 十 1. 

定理 8.2 对 于 任何 一 个 检索 算法 存在 某 个 规模 为 的 输入 使 得 该 算法 至 少 要 做 
Logn 1 次 比较 . 

证 ”由 命题 8. 3.n 个 结 点 的 决策 树 的 深度 & 至 少 为 Llogn 外 , 故 

W(n) = d+1=LognHH1 

上 述 定理 表明 : 对 于 有 序 表 的 检索 问题 ,在 以 比较 作为 基本 运算 的 算法 类 中 ,二 分 检索 

算法 在 最 坏 情 况 下 是 最 优 的 . 


8.5 排序 算法 的 时 间 复 杂 度 分 析 


排序 问题 : 给 定 规模 为 的 数组 L ,对 工 的 元 素 进 

基本 运算 : 数 的 比较 . 

我 们 先 对 一 些 常 用 排序 算法 进行 时 间 复 杂 度 的 分 析 , 得 到 这 个 算法 类 在 最 坏 情 况 和 平 
均 情 况 下 时 间 复 杂 度 的 上 界 ,然后 利用 决策 树 模型 给 出 算法 类 时 间 复 杂 度 的 一 个 下 界 . 

在 第 2 章 中 我 们 给 出 了 该 问题 的 两 种 算法 : 

快速 排序 : W(n) 二 On),A(n) 二 O(nlogn) 

归并 排序 : W(n)= 二 O(nlogn) ,A(n) 二 O(nlogn) 

下 面 再 给 出 两 种 排序 算法 : 冒 泡 排 序 和 堆 排 序 . 


8.5.1 冒 泡 排 序 算法 


考虑 整数 数组 二 ,排序 后 的 输出 是 把 工 中 的 数 按照 从 小 到 大 顺序 排 好 . 算法 从 位 置 1 开 
始 , 依 次 检查 相 邻 位 置 的 数 , 即 位 置 1 和 2 的 数 .位置 2 和 3 的 数 ,…… ,直到 位 置 n 一 1 入 
为 止 , 称 作 一 次 巡回 . 如 果 在 巡回 中 发 现 位置 i 的 数 大 于 位 置 i 十 1 的 数 ,意味 虐 中 有 一 个 道 
序 (一 对 数 , 较 大 的 数 排 在 较 小 的 数 的 前 面 ) ,这 时 候 算法 交换 这 两 个 相 邻 的 数 , 以 消除 这 个 
逆序 . 接 下 来 ,算法 将 继续 这 次 巡回 ,把 位 置 ;十 1 的 数 与 位 置 ;十 2 的 数 比 较 . 为 了 减少 重复 
操作 ,在 每 次 巡回 时 ,算法 将 把 发 生 最 后 一 次 交换 的 位 置 j 记 下 来 . 这 意味 着 在 j 后 面 的 数 
不 再 有 逆序 ,下 次 巡回 时 只 要 检查 到 /7 就 可 以 了 . 图 8. 4 给 出 一 个 算法 运行 的 实例 . 在 第 三 
次 巡回 时 最 后 交换 的 是 4 和 5, 第 四 次 巡回 就 不 需要 检查 4 后 面 的 数组 了 . 


原始 输入 和 
第 一 次 巡回 后 1 3 TT 9 
第 二 次 巡回 后 2 3 5 1 4 6 7 8 9 
第 三 次 巡回 后 多 首 T 了 台 全 世人 了 了 阁 和 沪 
第 四 次 巡回 后 闷 了 名 人 省 
第 五 次 巡回 后 1 2 3 4 5 6 7 8 9 


图 8.4 冒 泡 排序 算法 的 一 个 运行 实例 


第 一 次 巡回 至 多 做 "一 1 次 比较 . 第 一 次 巡回 后 最 大 数 必然 到 位 , 故 第 二 次 巡回 最 多 做 
n 一 2 次 比较 . 第 二 次 巡回 后 次 大 数 也 一 定 到 位 , 故 第 三 次 巡回 至 多 做 ”一 3 次 比较 . 依 此 类 
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推 ,算法 最 多 做 (7 一 十 (x 一 2) 十 … 十 1 二 n(n 一 1)/2 次 比较 .而 交换 次 数 不 会 超过 比较 次 
数 , 故 冒 泡 排序 算法 最 坏 情况 下 的 时 间 复 杂 度 是 O(n?). 

下 面 考虑 平均 情况 下 的 时 间 复 杂 度 的 分 析 . 个 数 的 排列 有 nn! 种 可 能 的 情况 ,因此 不 同 
的 输入 有 nn! 个 . 假定 每 个 输入 出 现 的 概率 相等 . 为 了 统计 算法 在 每 个 输入 所 做 的 比较 次 数 ， 
我 们 将 输入 两 两 分 成 一 组 ,使 得 每 组 的 两 个 输入 的 逆序 个 数 之 和 等 于 n(n 一 1)/2. 这 很 容易 
做 到 . 设 在 1,2,…,n 的 排列 中 , 排 在 i 的 后 面 并 且 小 于 i 的 元 素 个 数 记 作 b;,i=1， 
2,…,n. 序列 (bi ,bs,…,b,) 称 为 排列 的 逆序 序列 ,例如 二 8 的 排列 31658724, 在 1 后 
面 没有 比 1 小 的 数 , 因 此 bb 二 0, 在 2 后 面 也 没有 比 2 小 的 数 ,因此 b, 二 0, 在 3 后 面 有 1 和 2， 
因此 6 二 2, 类 似 的 有 b= 二 0,6s = 二 2,6s = 二 3,6; 二 2,bs 二 3, 因 此 逆序 序列 为 (0,0,2,0,2,3,2， 
3). 显然 ,排列 与 其 逆序 序列 是 一 一 对 应 的 ,不 同 排列 的 逆序 序列 不 一 样 , 恰 好 有 2z! 种 不 同 
的 逆序 序列 . 任意 给 定 排 列 ,其 逆序 序列 是 (51,65s,…,b,). 考虑 排列 ,其 逆序 序列 为 
(0 一 六 ,1 一 包 ,2 一 1 一 入) ,那么 a 与 a 含有 的 道 序 个 数 之 和 恰好 为 n(n 一 1)/2. 对 于 上 面 
的 排列 3 1 6 5 8 7 2 4, 其 逆序 序列 是 (0,0,2,0,2,3,2,3) ,与 它 分 到 同一 组 的 排列 ,其 逆序 
序列 应 该 是 (0,1,0,3,2,2,4,4) ,对 应 的 排列 是 42785613. 这 两 个 排列 含有 的 逆序 个 数 
分 别 为 12 和 16 ,所 含 逆序 总 数 为 12 十 16 王 28, 恰 好 等 于 (8X7)/2 一 28. 按照 这 种 办 法 把 
24 个 排列 分 成 n1/2 个 组 ,每 组 逆序 总 数 都 等 于 n(n 一 1)/2. 于 是 平均 逆序 数 为 n(n 一 1)/4， 
算法 的 平均 交换 次 数 为 n(n 一 1)/4. 因此 冒 泡 排 序 的 最 坏 情况 和 平均 情况 下 的 时 间 复 杂 性 
均 为 O(n?). 


8.5.2 堆 排 序 算 法 


堆 是 一 种 二 叉 树 ,树叶 至 多 分 布 在 最 深 的 两 层 . 堆 中 的 数据 存储 在 结 点 上 ,使 得 儿子 结 
点 中 的 数 不 超 过 父 结 点 中 的 数 . 对 于 个 结 点 的 堆 , 通 常用 1,2,…,n 标记 这 些 结 点 .标记 方 
法 是 : 从 根 到 最 深层 , 逐 层 从 左 到 右 依 次 标记 . 如 果 在 
倒数 第 二 层 上 既 有 内 部 结 点 ,也 有 叶 结 点 ,把 叶 结 点 排 
在 内 部 结 点 的 后 面 . 图 8.5 给 出 了 一 个 10 个 结 点 的 堆 
的 例子 . 可 以 用 长 为 n 的 数组 A 存储 堆 , 数 组 中 的 元 素 
A[ 癌 就 是 堆 中 结 点 i 的 元 素 . 在 这 样 的 堆 中 , 结 点 i 的 左 
儿子 的 标号 lef107) 二 2i, 右 儿子 的 标号 right(i) 二 2i 十 1. 
在 图 8.5 中 ,A[2]==14,lef1(2)==4,right(2) 二 5. 图 8.5 一 个 堆 的 实例 

下 面 考虑 堆 的 操作 . 

首先 介绍 整理 操作 Heapify(A.). 它 的 目标 是 把 一 个 输入 数组 A( 可 以 看 成 一 个 堆 结 
构 , 但 是 可 能 不 满足 下 述 条 件 : 父 结 点 的 数 不 小 于 儿子 结 点 的 数 ). 该 操作 从 结 点 i 出 发 , 直 
到 某 片 树叶 ,通过 交换 从 上 到 下 顺序 调整 路 径 上 的 数 , 使 得 父 结 点 的 数 不 小 于 子 结 点 的 数 . 
相关 算法 如 下 : 


算法 8.2 Heapify(A,iD 

输入 : 堆 结构 A,A 的 结 点 i 

输出 : 从 i 向 下 满足 堆 存 储 要 求 的 堆 结 构 
1. left) 

2 reright() 
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if /<heap-size[A] and A[/]>A[i] 

then largest<-l 

else largest<i 

rheap-size[A] and A[r]>A[largest] 


then largest<—r 


3 
4 
5 
对 六 
潍 
8. if largestA¥i 
9 


then exchange A[i]*™*A[largest] 
10. Heapify(A ,largest) 


图 8.6 给 出 了 操作 Heapify(A ,2) 的 过 程 及 结果 . 结 点 2 存 的 数 是 4, 它 的 左 儿 子 存 的 数 
是 14, 右 儿子 存 的 数 是 7. 经 过 算法 3 一 9 行 的 操作 , 较 大 的 儿子 14 与 4 交换 ,然后 算法 在 第 
10 行 递 归 执 行 Heapify(A ,4) ,实现 数据 4 与 8 的 交换 ,算法 结束 . 这 次 运行 将 结 点 2,4,9 的 
路 径 整理 完毕 ,输出 如 图 8. 6. 需要 注意 的 是 : 一 次 整理 只 能 完成 一 条 路 径 的 调整 ,并 不 能 保 
证 整理 后 的 整个 结构 满足 堆 的 要 求 . 

下 面 估计 整理 过 程 所 做 的 比较 次 数 . 每 次 调用 Heapify ,执行 O(1) 次 比较 ,因此 总 工作 
量 取 决 于 调用 次 数 . 不 难看 出 ,每 次 递归 调用 的 最 坏 情 况 是 : 所 进入 子 问题 的 规模 与 原 问题 
规模 之 比 达 到 最 大 的 情况 . 如 图 8. 7 所 示 , 这 恰好 是 左 子 树 含有 结 点 尽 可 能 多 , 右 子 树 含有 
结 点 尽 可 能 少 的 情况 . 设 左 子 树 结 点 数 为 zx, 那么 右 子 树 结 点 数 为 (z 一 1)/2, 整 个 堆 的 结 点 
数 为 


ZX 十 (z 一 1)/2 十 1 = (3x 十 1)/2 
子 问题 的 规模 ( 左 子 树 结 点 数 ) 与 原 问 题 规 模 之 比 不 超过 
2z/(3z 十 1) =2/3 
因此 得 到 关于 时 间 复 杂 度 的 递 推 不 等 式 
Tn) <T(2n/3) + O01) 
它 的 解 是 T(n) 二 B(logn) ,其 中 是 以 结 点 i 为 根 的 子 树 的 结 点 数 . 


图 8.6 操作 Heapify(A,2) 图 8.7 子 问 题 规模 的 上 界 


整理 操作 的 工作 量 也 可 以 表示 为 T(h) 二 8(h) ,这 里 的 hh 是 结 点 i 的 高 度 ( 距 树叶 的 最 
大 上 距离) 注意 同 一 层 的 结 点 的 深度 一 样 ,但 是 它们 的 高 度 可 能 不 同 . 树叶 的 高 度 都 等 于 0， 
但 是 树叶 可 能 分 布 在 堆 的 最 深层 ,也 可 能 分 布 在 次 深层 . 

下 面 考虑 堆 的 建立 . 堆 的 建立 是 自 底 向 上 进行 的 . 先 从 标号 最 大 的 内 结 点 开始 ,对 所 有 
的 内 结 点 调用 堆 的 整理 算法 ,直到 根 为 止 . 图 8. 8 给 出 了 一 个 建 堆 的 实例 . 不 难看 出 , 当 对 结 
点 i 进行 整理 时 , 它 的 两 个 儿子 在 这 之 前 已 经 完成 了 整理 工作 . 如 果 i 中 存 的 数 大 于 它 的 儿 
子 结 点 存 的 数 , 什 么 也 不 做 ;如 果 i 中 的 数 小 ,那么 通过 对 i 的 整理 只 在 从 i 到 某 片 树叶 的 一 
条 路 径 上 进行 交换 ,交换 的 结果 就 是 将 站 落 ” 到 路 径 中 适当 的 结 点 上 ,这 不 会 影响 其 他 路 径 
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图 8.8 堆 的 建立 


建 堆 的 算法 如 下 : 


算法 8.3 Build-Heap(A) 

输入 : 数组 A 

输出 : 堆 A 

二 和 ns] 

2. fori<-llength[A]/2] downto 1 do 
束 HeapiyGAsy 


下 面 分 析 建 堆 的 时 间 复 杂 度 . 

建 堆 的 时 间 复 杂 度 依赖 于 算法 行 3 调用 Heapify 的 次 数 , 即 堆 中 的 内 结 点 个 数 . 而 一 次 
调用 的 工作 量 与 结 点 的 高 度 相当 . 因此 ,把 堆 中 所 有 的 结 点 按照 高 度 求 和 ,就 是 建 堆 的 工作 
量 .用 公式 表示 为 


Logmj 


T(n) 二 >) 高 为 的 结 点 数 X O(h) 
h=0 
下 面 对 T(n) 给 出 估计 . 


引 理 8.1 个 结 点 的 堆 恰 好 有 [nn/2 片 树叶 . - 
证 设 堆 的 深度 为 d. 堆 的 树叶 只 分 布 在 d 和 4d 一 1 层 ,假设 d 层 KE 
有 xz 片 树叶 ,d 一 1 层 有 y 片 树叶 .下 面 分 情况 讨论 . en 
若 > 为 偶数 ,如 图 8.9 所 示 ,d 一 1 层 的 非 叶 结 点 恰好 有 z/2 个 . 
该 层 结 点 总 数 为 24-! ,因此 d 一 1 层 的 叶 结 点 数 > 一 2 一 z/2. 图 8.9 zx 为 偶数 


由 于 堆 中 的 d 一 1 层 是 满 的 ,从 根 到 d 一 1 层 的 结 点 总 数 为 的 情况 


地 oo 加 
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1 十 2 十 2 十 … 十 2 一 2 一 1 
再 加 上 4 层 的 叶 结 点 数 xz 就 得 到 堆 中 的 结 点 总 数 , 即 


ZX 十 24 一 1 二 


利用 上 述 两 个 结果 ,可 以 得 到 堆 中 叶 结 点 总 数 为 
] (24 + zx) 2 十 区 一 人 n 
z 二 > 一 z 十 2 = | 
对 于 z 为 奇数 的 情况 如 图 8. 10 所 示 ,类 似 的 分 析 可 以 得 到 


这 — 
2471 


ZX 十 y= 二 工 十 2! 二 一 a (1 信 
AYC) 
_ 2 二 +zx—l nn nn 
站 -|| > 
引 理 8.2 在 个 元 素 的 堆 中 高 度 为 的 层 上 至 多 存在 | Zr | 个 图 8 10 为 奇数 
的 情况 


结 点 . 
证 对 及 进行 归纳 . 

当 4=0 时 :| zf 上 | 郊 |, 正 是 堆 中 的 叶 结 点 数 ,根据 引 理 8. 1 ,命题 为 真 
假设 对 高 度 为 /一 1 的 堆 命 题 为 真 ,下 面 证 明 对 高 度 为 h 的 堆 命 题 也 为 真 . 设 了 表示 
7 个 结 点 的 堆 , 从 工 中 移 走 所 有 的 树叶 得 到 树 T',T' 的 结 点 数 为 n. 令 nm 表示 了 中 高 为 
儿 层 的 结 点 数 ,根据 归纳 基础 ,no 二 Fn/2 1 而 六 中 的 结 点 总 数 风 恰好 等 


减 去 T 中 的 叶 结 点 数 o, 即 
| 


易 见 工 中 高 度 为 h 的 层 恰好 是 TT' 中 高 度 为 A 一 1 的 层 , 即 


/ 
Nk 一 Nil 


FT 的 结 点 总 数 ? 


根据 归纳 假设 ,在 了 中 一 1 层 结 点 数 至 多 关公 | 于 是 得 到 


有 本 | 了 
-As 区 1-[ 儿 上 人 计 |- 语 
定理 8.3 nn 个 结 点 的 建 堆 算法 Build-heap 在 最 坏 情 况 下 的 时 间 复 杂 性 度 为 O(n). 
证 ”对 高 为 h 的 结 点 调用 Heapify 算法 的 时 间 至 多 是 O(h) ,根据 引 理 8. 2 ,高 为 六 的 结 


点 数 至 多 为 zz |, 因此 时 间 复杂 度 


和 pa A |00) of 2 ) [oko 
e 本 匡 
2 24i+1 一 2 针 :1 


h=0 


这 是 因为 在 这 个 式 子 中 求 和 的 结果 为 一 个 常数 . 即 
入 一 [0 十 了 Ft+ 训 二 |= [本 二 序 十 < 详 信守 | 


7 人 二 于 + | | 


章法 分 白 与 问题 的 计算 乾 杂 度 


二 请 -让 


了 
-下 
最 后 考虑 堆 排序 算法 . 由 于 堆 的 最 大 元 素 存 在 根 结 点 ,把 根 中 的 元 素 与 最 大 标号 结 点 中 
的 元 素 ( 数 组 最 后 位 置 的 元 素 ) 交 换 , 这 样 就 把 最 大 元 素 移 到 了 数组 的 最 后 位 置 , 这 就 是 它 在 
排 好 序 的 数组 中 应 该 放 的 位 置 . 把 这 个 元 素 从 堆 中 删 去 ,得 到 规模 减少 1 的 堆 结构 (可 能 不 
是 堆 , 因 为 换 到 根 结 点 的 数 可 能 小 于 它 的 儿子 结 点 中 的 数 ). 对 这 个 堆 结构 的 根 进 行 一 次 整 
理 操作 ,就 得 规模 减少 1 的 堆 . 这 个 堆 的 最 大 元 素 仍 旧 在 根 结 点 . 递归 地 对 这 个 堆 进行 同样 
的 操作 ,每 次 操作 后 堆 的 规模 减 1, 直 到 剩 下 最 后 一 个 元 素 为 止 , 它 恰好 就 是 堆 中 的 最 小 元 
素 .图 8. 11 给 出 了 一 个 堆 排 序 算法 的 运行 实例 .算法 的 伪 码 如 下 : 
算法 8.4 Heap-sort(A) 
输入 : 数组 A 
输出 : 排 好 序 的 数组 A 
1. Build-Heap(A) 
2. fori<-length[A] downto 2 do 


3. exchange A[1]*>A[ 
4 heap-size[ A]<-heap-size[A]—1 
误 HeapiiyCA, I 


DOD DOD) 

© EB 
U OV OO © OY © 
DDD (DD, 


图 8.11 一 个 堆 排 序 算法 的 运行 实例 


击 吕 中 
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下 面 考查 算法 Heap-sort 的 时 间 复 杂 度 . 根据 定理 8. 3, 行 1 建 堆 的 操作 的 时 间 是 
O(n) , 行 2 的 for 循环 执行 n 一 1 次 ,每 次 调用 Heapify 操作 至 多 做 O(logn) 次 比较 ,因此 堆 
排序 的 最 坏 情 况 下 的 时 间 复 杂 度 为 O(nlogn). 


8.5.3 排序 算法 的 决策 树 与 算法 类 时 间 复 杂 度 的 下 界 


前 面 讨论 了 冒 泡 排序 和 堆 排 序 算法 ,并 分 析 了 它们 在 最 坏 情 况 或 平均 情况 下 的 时 间 复 
杂 度 . 回顾 第 2 章 中 讲 到 的 快速 排序 和 二 分 归并 排序 算法 ,这 些 算 法 在 最 坏 情况 下 和 平均 情 
况 下 的 运行 时 间 可 以 达到 O(nlogn). 我 们 关心 的 是 : 是 否 存 在 更 快 的 排序 算法 ? 换 句 话 
说 ,在 以 元 素 比 较 作为 基本 运算 的 排序 算法 类 中 最 优 的 算法 是 什么 ? 下 面 用 决策 树 解决 这 
个 问题 . 排序 问题 的 决策 树 构造 方法 如 下 : 

构造 方法 二 设 A 是 以 元 素 比 较 作 为 基本 运算 的 排序 算法 ,其 输入 了 一 {ziyzz，…， 
Zz,) , 它 的 决策 树 中 结 点 标记 方法 如 下 : 

(1) A 第 一 次 比较 的 元 素 为 x; ,zj ,那么 树 根 标记 为 (i, 站 . 

(2) 假设 结 点 已 经 标记 为 (i,j) ,按照 下 面 的 原则 标记 A 的 儿子 

@ 当 zx 二 zj 时 , 若 算 法 结束 ,k 的 左 儿子 标记 为 输出 ; 

若 下 一 步 比较 元 素 zy ,zxs, 那 么 的 左 儿 子 标记 为 (p,q). 

@ 当 zx; 时 , 若 算法 结束 , 的 右 儿子 标记 为 输出 ; 

若 下 一 步 比 较 元 素 x ,x ,那么 的 右 儿 子 标记 为 (p,q). 

图 8.12 给 出 了 n= 二 3 时 冒 泡 排 序 的 决策 树 . 当 输 入 为 {14,10,5)} 时 ,算法 第 一 次 将 比较 
zi 一 14 和 zs 二 10, 根 结 点 标记 为 (1 ,2). 比较 结果 是 x 二 xs ,于 是 算法 交换 zx: 和 zs 并 沿 着 
右 分 支 向 下 到 右 儿 子 .下 一 步 比较 z= 二 14 和 x 二 5, 于 是 这 个 结 点 标记 为 (1,3), 这 次 比较 
结果 是 zi 二 zs ,交换 zk 和 zs ,算法 继续 沿 右 分 支 向 下 ,本 次 巡回 结束 ,此 刻 数组 元 素 的 排列 
是 10,5,14. 记 下 本 次 发 生 交换 的 最 后 位 置 是 2. 算法 进入 第 二 个 巡回 ,首先 比较 的 元 素 是 
zz 一 10 和 zs 一 5, 交 换 z 和 x3, 结 点 标记 为 (2,3), 本 次 巡回 达到 上 次 标记 位 置 2, 巡 回 结 
东 , 将 本 次 巡回 发 生 最 后 交换 位 置 标记 为 1. 如 果 标 记 为 1, 将 不 再 做 更 多 的 巡回 ,算法 结束 . 
算法 的 输出 是 zx; 二 5,xs 二 10,zi 二 14, 于 是 叶 结 点 标记 为 (3.,2,1), 算法 在 输入 {14,10,5) 的 
路 径 是 这 棵 决策 树 的 最 右 分 支 的 路 径 , 输 出 数组 为 za ,zz ,zi. 


图 8.12 冒 泡 排序 算法 的 一 棵 决策 树 


对 于 以 元 素 比 较 作 为 基本 运算 的 排序 算法 A, 给 定 任意 输入 工 , 就 对 应 了 A 的 决策 树 中 
从 树 根 到 某 片 树叶 的 一 条 路 径 , 树 叶 的 标记 代表 了 该 输入 排 好 序 后 所 有 元 素 的 排列 顺序 , 算 
法 所 做 的 比较 次 数 正 好 等 于 路 径 中 的 结 点 个 数 . 不 难看 出 ,算法 在 最 坏 情况 下 恰好 选择 了 一 
条 最 长 的 路 径 , 这 条 路 径 上 的 结 点 个 数 恰好 等 于 树 的 深度 (路 径 上 的 边 数 ) 加 1. 不 同 的 排序 
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算法 对 应 的 决策 树 结 构 是 不 一 样 的 .但 是 它们 的 树叶 数 都 等 于 2!. 下面 的 问题 是 : 对 于 任意 
一 棵 具有 n! 片 树叶 的 二 又 树 , 它 的 深度 至 少 是 多 少 ? 这 个 值 正好 代表 了 该 算法 类 中 任何 算 
法 在 最 坏 情 况 下 所 做 比较 次 数 的 一 个 下 界 . 
在 决策 树 中 相同 的 结 点 在 路 径 上 可 能 出 现 多 次 . 考查 输入 {2,1,4,3) ,算法 第 一 次 巡回 
的 比较 是 : (2,1)、(2,4)、(4,3), 其 中 第 一 与 第 三 次 比较 后 会 发 生 交 换 , 巡 回 后 的 数组 是 
{1,2,3,4). 尽管 已 经 排 好 ,但 因为 最 后 一 次 交换 发 生 在 位 置 3 和 4 之 间 , 算 法 还 要 做 下 一 
次 巡回 . 第 二 次 巡回 的 比较 是 (1,2) 和 (2.3), 其 中 (1,2) 的 比较 是 元 余 的 操作 . 为 了 计算 的 
方便 , 先 去 掉 决 策 树 中 的 只 有 1 个 儿子 的 内 结 点 ,在 这 个 结 点 的 比较 运算 实际 上 是 多 余 的 . 去 
掉 这 样 的 结 点 ,得 到 二 又 树 叫 做 B- 树 ,决策 树 的 深度 不 少 于 B- 树 的 深度 ,B- 树 也 有 2! 片 树叶 . 

引 理 8.3 ”对 于 给 定 的 ,任何 通过 比较 对 n 个 元 素 排 序 算 法 的 决策 树 的 深度 至 少 为 
flogcz1) 1. 

证 决策 树 (B- 树 ) 的 树叶 有 xn! 片 ,根据 8. 3 节 的 命题 8.4, 有 nn! 三 2 ,于 是 dlog(n1)1. 

定理 8.4 任何 通过 元 素 的 比较 对 ) 个 元 素 排序 的 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 不 
低 于 [log(n1)1, 近 似 为 nlogn 一 1. 5n. 

证 最 坏 情 况 的 比较 次 数 为 决策 树 的 深度 . 由 引 理 8. 3, 树 深 至 少 为 


log(n!)= Dlogj > | logzdz 一 loge| inzdz 
j=1 


loge(nlnn—n++1) = nlogn— nloget loge 
~ nlogn— 1.5n 

通过 上 面 的 分 析 可 以 看 到 时 间 复 杂 度 为 O(nlogn) 的 排序 算法 在 最 坏 情况 下 的 阶 已 经 
达到 最 优 .下面 考虑 算法 类 在 平均 情况 下 的 时 间 复 杂 度 的 下 界 . 

用 epl(T) 表 示 在 B- 树 中 从 根 到 树叶 的 所 有 路 径 的 长 度 之 和 . 换 句 话说 ,这 个 值 代表 算 
法 对 每 个 可 能 的 输入 (总 计 ! 个) 都 运算 1 次 所 做 的 比较 次 数 之 和 . 假设 所 有 的 输入 出 现 的 
概率 相等 ,那么 epl(T)/n! 的 值 则 代表 该 算法 在 平均 情况 下 的 时 间 复 杂 度 . 如 果 找 到 所 有 决 
策 树 的 epl(T)/n! 值 中 的 最 小 值 , 则 代表 该 算法 类 在 平均 情况 下 时 间 复 杂 度 的 一 个 下 界 .我 
们 不 可 能 枚 举 所 有 有 具有 nl! 片 树叶 的 B- 树 ,为 了 解决 这 个 问题 ,需要 分 析 一 下 : 什么 结构 的 
B- 树 其 epl 值 达 到 最 小 . 

引 理 8.4 在 具有 : 片 树叶 的 所 有 B- 树 中 ,树叶 分 布 在 两 个 相 邻 层 上 的 树 的 epl 值 最 小 . 

证 设 树 工 的 深度 为 & ,假设 在 d 和 4d 一 1 层 上 方 的 第 & 层 上 有 1 片 树叶 z,A<<d 一 1 
取 qd 一 1 层 的 某 个 结 点 y,y 的 两 个 儿子 是 第 d 层 的 树叶 . 将 y 的 两 个 儿子 上 移 , 作 为 xz 的 儿 
子 加 到 树 中 ,得 到 树 T'. 下 面 证 明 ep1(T') 小 于 epl(T). 

考查 了 与 工 的 区 别 . 在 工 中 有 两 条 从 根 到 > 的 两 个 儿子 的 路 径 . 长 度 都 是 4d; 而 TT 没 
有 这 两 条 路 径 , 但 是 增加 了 一 条 从 根 到 y 的 路 径 ,长度 为 4 一 1. 此 外 ,在 工 中 有 一 条 从 根 到 
Zz 的 路 径 , 长 度 为 &; 工 中 没有 这 条 路 径 , 但 是 增加 了 两 条 从 根 经 过 & 到 新 移 来 的 两 个 结 点 
的 路 径 , 这 两 条 路 径 长 度 都 是 A 十 1, 于 是 有 

epl(T) 一 epl(T) 一 (24d 十 A) 一 [(Z 一 1 十 2(R 十 1)] 

2 十 二 一 证 二 一 中 一 分 一 妈 一 才 一 了 三 疝 【《 国 施 可 过 证 1 

这 说 明 从 一 棵 B- 树 出 发 .通过 将 最 底层 的 一 组 兄弟 树叶 上 移 , 只 会 减少 它 的 epl 值 . 经 过 有 限 
步 上 移 操作 后 ,所 有 的 树叶 最 终 将 分 布 在 最 底下 相 邻 的 两 层 上 ,而 这 棵 树 的 epl 值 将 达到 最 小 . 


才 oo 如 
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不 难看 到 ,上 述 具 有 最 小 epl 值 的 树 正 是 一 个 堆 结构 . 

定理 8.5 在 21! 个 输入 等 概率 的 分 布下 ,任何 通过 元 素 比 较 对 7 个 项 排序 的 算法 平均 
比较 次 数 至 少 为 Llogn1j, 近 似 为 nlogn 一 1. 5n. 

证 算法 类 中 任何 算法 的 平均 比较 次 数 是 该 算法 决策 树 (B- 树 )T 的 epl(T)/n1, 根 据 
引 理 8. 4, 当 树叶 分 布 在 相 邻 两 层 上 的 B- 树 的 epl 值 达到 最 小 .下面 计算 这 种 B- 树 的 平均 
路 径 长 度 . 

若 B- 树 是 一 棵 完全 二 又 树 , 所 有 的 树叶 都 在 最 底层 . 于 是 所 有 的 路 径 长 度 都 等 于 树 深 
d. 树 叶片 数 1 二 2*. 那么 有 


epl(T)} = = llogt | 和 


若 B- 树 不 是 完全 树 , 如 图 8. 13 所 示 , 设 d 层 和 4d 一 1 层 树叶 数 AC”, ™ 


分 别 为 z+,y, 那 么 


z/2 十 y 一 24-1 图 8.13 树叶 分 布 两 层 
解 得 z=2t 一 24 ,y 王 22 一 大 
epl(T)= zd+y(d—1)= (2 一 24)d 十 (24 一 站 (4 一 1) 
td —2*+t=t(d—1)+2(t—241) 
= tllogt |+2(—2) (llogt {= d—1) 


于 是 
A 二 eplCT) 至 二 CoallogcaD ] 上 2(z1 一 20eopD0D)) = llog(n!) J+e, 0<e<l 


x nlogn— 1.5n 


注意 在 上 面 的 推导 中 用 到 了 下 面 的 结果 : 


1 1 
0 二 14 一 2begoD] 一 21 一 2ogoD- = nC 琶 


2 2 
上 面 关 于 排序 算法 的 分 析 结 果 可 以 总 结 成 表 8. 1. 
表 8.1 有 关 排 序 算法 的 分 析 结果 
算 法 最 坏 情况 平均 情况 占用 空间 时 间 上 的 最 优 性 
冒 泡 排 序 On’) On:) 原 地 
快速 排序 Orn) O(nlogn) O(logn) 平均 时 间 最 优 
归并 排序 O(nlogn) Onlogn) On) 最 优 
堆 排 序 Onlogn) Onlogn) 原 地 最 优 


8.6 选择 算法 的 时 间 复 杂 度 分 析 


选择 问题 也 是 一 类 重要 的 问题 ,在 第 2 章 曾 经 给 出 了 选 最 大 元 素 的 算法 Findmax( 算 
法 2.7) ,同时 选 最 大 和 最 小 元 素 的 算法 FindMaxMin (算法 2. 9), 选 第 二 大 元 素 的 算法 
FindSecond( 算 法 2. 10) 以 及 一 般 性 选择 第 & 小 元 素 ( 含 中 位 数 ) 的 算法 Select( 算 法 2. 11). 
表 8. 2 给 出 了 选择 算法 的 最 坏 情 况 下 的 时 间 复 杂 度 . 
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表 8.2 选择 算法 的 最 坏 情 况 下 的 时 间 复 杂 度 


问 题 算 法 最 坏 情 况 空 间 
选 最 大 顺序 比较 一 和 O00) 
顺序 比较 2n—3 O01) 
选 最 大 和 最 小 
算法 FindMaxMin Rais 2 OO) 
顺序 比较 2n—3 O01) 
选 第 二 大 
锦标 赛 方法 n+t[logn |—2 O(n) 
排序 后 选择 Onlogn) O(logn) 
选中 位 数 
算法 Select Om ~2. 95n O(logn) 


在 8. 2 节 已 经 证 明了 算法 Findmax 是 求解 找 最 大 问题 在 最 坏 情 况 下 时 间 上 最 优 的 算 
法 . 本 节 将 证 明 其 他 一 些 选择 算法 的 最 优 性 . 证 明 方法 采用 构造 最 坏 输入 的 方法 . 基本 思想 
是 : 设计 一 组 构造 输入 的 规则 .针对 任意 算法 A 的 执行 步骤 ,使 用 这 组 规则 可 以 逐步 生成 算 
法 A 的 一 个 规模 为 的 输入 ,使 得 算法 A 在 这 个 输入 上 做 尽 可 能 多 的 工作 . 如 果 这 个 输入 
恰好 是 规模 为 n 的 输入 中 的 最 坏 情 况 ,那么 算法 A 在 这 个 输入 上 的 工作 量 就 是 它 在 最 坏 情 
况 下 的 时 间 复 杂 度 . 但 是 在 许多 情况 下 ,由 于 构造 输入 的 规则 选择 得 不 好 ,或 者 不 存在 对 任 
何 算法 都 适用 简单 的 构造 规则 ,构造 出 来 的 输入 可 能 不 一 定 是 该 算法 计算 的 最 坏 情况 . 即使 
这 样 ,对 这 个 输入 的 估计 也 提供 了 算法 在 最 坏 情况 下 时 间 复 杂 度 的 一 个 下 界 , 只 不 过 这 个 下 
界 不 一 定 是 紧 的 . 针对 该 算法 类 的 任何 算法 ,首先 依据 上 述 规 则 构造 一 个 输入 ,然后 估计 算 
法 在 这 种 输入 下 至 少 需 要 做 多 少 工作 ,那么 就 找到 了 算法 类 时 间 复 杂 度 的 一 个 下 界 . 


8.6.1 找 最 大 和 最 小 问题 


不 妨 设 输入 中 的 nn 个 数 彼此 不 等 ,A 为 通过 比较 运算 找 最 大 和 最 小 的 任意 算法 .算法 的 
输出 maz 是 最 大 数 ,min 是 最 小 数 . 每 一 次 比较 ,两 个 数 中 较 大 的 数 被 标记 为 W, 较 小 的 数 
被 标记 为 Ls 为 得 到 mazr.A 必须 保证 有 n | 个 数 比 max 小 ,通过 与 max 的 比较 被 淘汰 ; 
同样 为 了 得 到 min,A 也 必须 保证 有 一 1 个 数 比 min 大 ,通过 与 min 的 比较 而 淘汰 . 因此 
算法 结束 时 ,在 输入 的 个 数 上 ,必须 带 有 下 述 信息 : 有 一 2 个 数 既 不 是 最 大 也 不 是 最 小 ， 
同时 带 有 W 和 工 两 个 标记 ;有 一 个 数 只 带 有 W 标记 , 它 就 是 maz, 另 一 个 数 只 带 有 工 标 
记 , 它 就 是 min. 如 果 最 终 n 个 数 不 是 这 种 状态 ,算法 一 定 不 会 输出 正确 的 结果 . 每 个 标记 是 
1 个 信息 单位 ,为 了 得 到 解 ,算法 需要 通过 比较 得 到 这 2n 一 2 个 信息 单位 . 

如 下 定义 数 的 状态 : 没 参 加 过 比较 的 数 的 状态 为 N; 在 每 次 比较 中 状态 可 能 改变 ;改变 
的 结果 参见 表 8. 3. 


表 8.3 一 次 比较 后 x 状态 的 变化 


比较 前 z 的 状态 N Ww i WL 
当 工 大 时 ,状态 变 为 WwW Ww WL WL 
当 工 小 时 ,状态 变 为 Eb WL EL WL 


容易 看 到 ,只 有 比较 后 数 的 状态 改变 才能 增加 信息 单位 .状态 不 改变 将 不 增加 信息 单 
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位 . 两 个 数 通过 一 次 比较 增加 的 信息 单位 数 可 能 不 同 (0,1,2). 如 果 两 个 数 的 状态 都 是 N , 那 
么 一 次 比较 后 的 状态 分 别 变 成 W 和 工 , 增 加 2 个 信息 单位 ;如 果 z 的 状态 是 W,y 的 状态 是 
L, 当 zy 时 ,比较 后 x 与 y 的 状态 保持 不 变 , 增 加 0 个 信息 单位 ;如 果 zx 二 y, 那 么 x 与 y 
的 状态 都 变 成 WL, 共 增加 2 个 信息 单位 . 这 说 明 比 较 后 所 增加 的 信息 单位 数 依赖 于 工 与 y 
的 值 . 构造 输入 的 原则 是 : 通过 对 参与 比较 的 数 x 和 > 赋值 ,使 得 x 与 y 比较 后 状态 尽 可 能 
不 变 或 少 变 , 以 便 在 比较 中 得 到 最 少 的 信息 单位 量 ,从 而 迫使 算法 通过 更 多 的 比较 次 数 来 得 
到 必需 的 2n 一 2 个 信息 单位 . 表 8.4 给 出 了 对 x 和 yy 赋值 的 策略 . 
表 8.4 对 x 与 y 赋值 的 策略 


工 与 y 的 状态 分 配 输入 值 的 策略 新 状态 提供 信息 单位 数 
N,N zx>y W,L 5 
W,N;WLN zx>y W,L;WL,L 1 
L,N zx<y L,W 1 
WwW z>y W,WL 1 
i r>y WL,l 1 
W,L;WL,L;W, WL z>y 不 变 0 
WL,WL 保持 原 值 不 变 0 


定理 8.6 ”任何 通过 比较 找 最 大 和 最 小 的 算法 至 少 需 要 [3n/2 | 一 2 次 比较 . 

证 设 A 是 任何 找 最 大 最 小 的 算法 .参见 表 8.4. 通 过 一 次 比较 得 到 两 个 信息 单位 的 只 
有 两 个 数 处 于 N,N 状态 的 情况 . A 至 多 有 ln/2 次 比较 可 以 处 于 这 种 状态 ,这 些 比 较 至 多 
得 到 2 Ln/2 长 2 个 信息 单位 . 对 于 其 他 情况 ,1 次 比较 至 多 获得 1 个 信息 单位 ,因此 至 少 还 
需要 再 做 "一 2 次 比较 才能 得 到 所 有 的 2n 一 2 个 信息 单位 . 

当 为 偶数 时 ,A 做 的 比较 次 数 至 少 为 

/2 Hnm2= 3n/2—2=[3n/2 上 -2 
当 n 为 奇数 时 ,A 做 的 比较 次 数 至 少 为 
lx/2 片 ?2 一 2 十 1 一 (一 1)/2 十 1 十 2 一 2 一 [3z/2 2 
结论 ”FindMaxMin 是 最 优 算法 . 


8.6.2 找 第 二 大 问题 


不 妨 设 输入 中 的 n 个 数 彼此 不 等 . 对 于 这 个 算法 类 ,构造 最 坏 输入 的 基本 思想 与 8. 6. 1 
节 的 方法 类 似 ,也 是 通过 对 元 素 的 赋值 迫使 算法 做 更 多 的 比较 运算 . 任何 找 第 二 大 的 算法 其 
工作 量 都 由 两 部 分 构成 .为 了 确认 第 二 大 元 素 . 必 须知 道 哪个 是 最 大 元 素 . 只 有 通过 与 最 大 
元 素 直 接 比 较 而 淘汰 的 元 素 才 有 可 能 是 第 二 大 元 素 . 因 此 确认 最 大 元 素 是 找 第 二 大 元 素 必 
不 可 少 的 ,这 是 第 一 部 分 工作 量 . 前 面 已 经 证 明 : 无 论 什么 算法 ,确认 最 大 元 素 的 比较 次 数 
至 少 是 "一 1. 第 二 部 分 工作 量 就 是 在 被 最 大 元 素 直 接 淘汰 的 元 素 中 找 最 大 (原始 输入 的 第 
二 大 ) 的 工作 量 , 这 些 比较 发 生 在 所 有 被 最 大 元 素 直 接 淘汰 的 元 素 之 间 . 这 两 部 分 工作 量 性 
质 不 同 ,第 一 部 分 工作 量 与 元 素 的 赋值 无 关 , 任 何 输入 都 一 样 . 第 二 部 分 工作 量 可 以 根据 算 
法 步 又 通过 对 元 素 的 赋值 加 以 控制 . 我 们 的 想法 就 是 : 尽量 增加 最 大 元 素 直 接 参 与 的 比较 
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次 数 ,以 便 尽 可 能 多 的 元 素 被 最 大 元 素 淘汰 ,参与 第 二 大 的 竞争 ,从 而 加 大 算法 第 二 部 分 工 
作 量 . 这 样 构造 的 输入 将 可 能 对 应 于 算法 运行 的 最 坏 情况 . 如 何 增加 最 大 元 素 参 与 比较 的 次 
数 ? 直观 的 想法 是 : 两 个 元 素 比 较 , 原 来 “ 赢 ”( 比 较 中 较 大 ) 得 较 多 的 继续 “ 赢 ”, 可 以 通过 更 
新 元 素 的 赋值 来 做 到 这 一 点 . 

下 面 考虑 元 素 的 赋值 规则 . 先 定义 元 素 xz 的 权 w(zx), 表 示 以 xz 为 根 的 子 树 中 的 结 
点 数 . 

赋值 规则 

(1) 初始 每 个 元 素 的 权 都 是 1. 

(2) 在 算法 运行 时 只 对 在 比较 中 没有 “ 输 ” 过 ( 权 大 于 0) 的 元 素 赋值 . 

(3) 如 果 w(z) 二 0,w(y) 二 0, 算 法 把 工 与 y 进行 比较 ,按照 下 述 原则 更 新 w(x) 与 
wy): 

@O 若 zw(Cz) 三 zw(y), 则 并 的 赋值 大 于 > 的 赋值 (如 果 不 满足 ,就 增加 xz 的 值 ), 同 时 令 
wT)w(z) 十 w(y) ,wl(y) 一 0; //x* 说 "得 多 ,x 继续 “ 赢 ” 

@ 车 ww(z) 二 w(y), 则 y 的 赋值 大 于 xz 的 赋值 (如 果 不 满足 ,就 增加 > 的 值 ), 同 时 令 
wy)<—w(Zz) 十 w(y) ,rw(z) 一 0; //y* 启 "多 ,y 继续 “ 赢 ” 

(4) 如 果 w(x)= 二 w(y)= 二 0,zx,y 值 不 变 。 //zx 与 y 比较 对 于 确定 第 二 大 无 意义 

表 8.5 给 出 一 个 根据 算法 A 的 步 又 对 输入 赋值 的 实例 . 对 这 个 实例 的 赋值 过 程 可 以 用 
图 8. 14 中 的 树 来 表示 . 设 输入 元 素 是 zi ,zs ,za .x4 ,Xs ,算法 A 的 比较 次 序 依 次 是 zi 与 zz， 
zl 与 zs ,zs 与 ,Xi 与 x;，…. 部 分 赋值 过 程 的 描述 见 图 8. 14. 

表 8.5 一 个 赋值 的 实例 


wx) w(x2) w(x3) w(x) w(xs) 值 
初始 1 1 1 1 1 类 9 类。 关 s 关 。 关 
第 1 步 zi>z 0 1 1 1 20，10w wy 打 9 长 
第 2 步 zi 二 zx S$ 0 0 1 1 20,10,15,.% »* 
第 3 步 总 二 4 3 0 0 0 2 20,10,15,30,40 
第 4 步 二 zx 3 0 0 0 0 41,10,15,30,40 


初始 时 刻 ,zi ,zs ,x3 ,x4 ,zs 都 没有 被 赋值 ,用 * 表示 ,w(x1) 二 w(xz2) 二 … 二 w(xs) 二 1 
这 时 每 个 结 点 都 没 参与 过 比较 ,用 孤立 结 点 表示 ,是 一 棵 平凡 树 . 每 棵 树 的 结 点 数 1 恰好 等 
于 根 结 点 的 权 . 

算法 第 一 步 将 zi 与 rs 进行 比较 ,w(xz1) 二 w(xs) 二 1. 按照 赋值 规则 3,zo(zi) 一 2， 
(zz) 一 0, 可 以 令 习 一 20,z 一 10. 在 图 中 以 zs 作为 zi 的 儿子 ,将 zs 为 根 的 子 树 附 加 到 六 
为 根 的 树 上 . 这 时 根 结 点 的 权 w(xzi) 二 2 是 树 中 结 点 总 数 ,zz 的 权 w(xs) 二 0. 

算法 第 二 步 将 zi 与 zs 比较 ,w(xzi)=2,w(zxs)= 二 1. 按照 赋值 规则 3, 令 w(xi)==3， 
(za) 一 0, 可 以 令 zs 二 15. 在 图 中 以 zs 作为 zi 的 儿子 .将 zs 为 根 的 子 树 附加 到 xz 为 根 的 
树 上 . 这 时 (zi) 王 3, 是 此 刻 以 zi 为 根 的 子 树 中 的 结 点 数 ,zs 的 权 ww(Czs ) 一 0. 

算法 第 三 步 将 xs 与 zx 比 较 ,zw(zs) 一 zwCz) 王 1. 按 照 赋值 规则 3, 令 ww(zs) 一 2,zw(Czi) 一 
0, 可 以 令 zs; 二 40,z4 二 30. 在 图 中 以 zs 作为 zs 的 儿子 ,将 zs 为 根 的 子 树 附 加 到 zs 为 根 的 
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图 8.14 一 个 赋值 过 程 


树 上 . 

算法 第 四 步 将 zi 与 zs 比较 ,w(xz1) 二 3,w(zs) 二 2. 按照 赋值 规则 3, 令 ww(z) 一 5， 
mw(zs) 一 0, 这 时 需要 增加 zi 的 值 , 令 zi 一 41. 在 图 中 以 zs 作为 xi 的 儿子 ,将 zs 为 根 的 子 
树 附 加 到 zi 为 根 的 树 上 . 至 此 ,ww(z) 王 5. 全 部 5 个 结 点 都 在 zi 为 根 的 树 中 ,显然 树 根 
zi 是 最 大 元 素 ,zi 的 所 有 儿子 恰好 是 与 zi 通过 直接 比较 而 被 淘汰 的 元 素 .下面 要 做 的 是 : 
针对 这 个 输入 ,估计 算法 通过 与 最 大 元 素 直 接 比较 而 淘汰 的 元 素 个 数 . 

引 理 8.5 ”任何 找 第 二 大 元 素 的 算法 ,针对 上 述 赋值 规则 产生 的 输入 ,通过 与 最 大 元 素 
的 比较 而 直接 淘汰 的 元 素数 至 少 是 [logn 1 

证 ”根据 上 述 规则 ,赋值 结束 时 根 的 权 是 ”其 他 结 点 的 权 都 是 0. 令 wi 表示 最 大 元 素 
在 它 通 过 第 & 次 比较 后 形成 以 它 为 根 的 子 树 的 结 点 数 . 假设 第 & 次 比较 是 最 大 元 与 zx 的 比 
较 . 则 根据 * 赢 者 继续 赢 ” 的 赋值 规则 ,比较 前 以 最 大 元 为 根 的 子 树 中 的 结 点 数 rw- 大 于 或 
等 于 以 z 为 根 的 子 树 中 的 结 点 数 凤 (zz). 而 内 一 zo 十 mw(z) ,于 是 zw 和 妥 2rzo ii, 令 天 是 算法 
运行 时 最 大 元 与 权 不 为 0 的 结 点 的 比较 次 数 . 则 

n= wk < 2kruo < 2 一 K > logn=>K [lognl 

定理 8.7 任何 通过 比较 找 第 二 大 的 算法 至 少 需 要 nn 十 [logn| 一 2 次 比较 . 

证 首先 必须 确定 最 大 元 素 , 至 少 需 要 nn 一 1 次 比较 . 由 引 理 8. 5 .通过 与 最 大 元 素 比 较 
而 被 淘汰 的 元 素数 K 宇 [logn1 为 确定 第 二 大 ,还 要 淘汰 KK 一 1 个 元 素 , 至 少 用 [logn| 一 1 次 
比较 . 

结论 ”锦标赛 方法 是 找 第 二 大 的 最 优 算法 . 


8.6.3 找 中 位 数 的 问题 


不 妨 设 n 为 奇数 , 且 输 入 工 中 的 nn 个 数 彼此 不 等 .假设 median 是 工 的 中 位 数 ,为 了 找 
到 median, 必 须 确定 在 其 他 的 n 一 1 个 数 中 ,有 (n 一 1)/2 个 数 小 于 median, 而 另外 (n 一 1)/2 个 
数 大 于 median. 换 句 话说 ,这 nn 一 1 个 元 素 在 算法 结束 时 必须 带 有 和 且 只 能 带 有 1 个 “小 于 ” 
(或 * 大 于 ”) 信 息 . 这 些 * 小 于 "或 “大 于 "的 信息 需要 通过 元 素 之 间 的 比较 得 到 . 当然 ,与 找 第 
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二 大 问题 不 一 样 ,这 里 的 比较 不 一 定 是 这 个 元 素 直 接 与 median 的 比较 ,也 可 能 是 间接 的 比 
较 . 比如 算法 先 比较 了 > 与 =, 知 道 z= 二 y, 后 来 算法 又 比较 了 > 与 median, 知 道 > 之 median, 那 
么 一定 大 于 median. 如 果 算 法 设计 得 足够 聪明 ,可 能 不 需要 再 进行 与 median 的 直接 比较 ， 
就 可 以 最 终 确 认 x 应 该 带 上 “大 于 ”信息 . 这 里 必须 注意 ,算法 在 比较 与 > 或 y 与 median 时 ， 
还 不 知道 median 就 是 最 终 输出 的 那个 中 位 数 . 当 确认 了 中 位 数 median 的 时 候 , 算 法 就 应 该 停 
止 了 . 如 果 还 不 停止 ,这 样 的 算法 只 能 是 一 个 笨 的 算法 ,因为 它 做 了 元 余 的 工作 . 

称 那 些 对 得 到 上 述 * 小 于 ?或 “大 于 ”信息 有 贡献 的 比较 是 决定 性 的 比较 ,而 那些 不 能 提 
供 * 小 于 ?或 “大 于 ”信息 的 比较 是 非 决 定性 的 比较 . 例如 上 面 提 到 = 之 y 和 >y 二 median 的 情 
况 ,z 与 y 的 比较 、y 与 median 的 比较 是 决定 性 的 ;而 对 于 x 二 median 和 y 之 median 的 情 
况 ,y 与 x 的 比较 就 是 非 决 定性 的 ,因为 这 个 比较 既 不 能 确认 y 与 median 的 大 小 关系 ,也 不 
能 确认 < 与 median 的 大 小 关系 . 这 种 非 决定 性 的 比较 是 对 正确 输出 所 需要 的 信息 量 没有 任 
何 贡 献 的 元 余 工 作 . 对 任何 求 中 位 数 的 算法 来 说 ,必须 完成 的 决定 性 比较 有 n 一 1 次 ,而 其 他 非 
决定 性 比较 次 数 对 不 同 算法 是 不 一 样 的 . 如 果 在 一 个 输入 的 计算 中 所 做 的 元 余 工作 越 多 ,算法 
运行 的 效率 就 越 低 , 正 是 算法 的 最 坏 情 况 . 我 们 的 想法 是 : 设计 一 个 对 输入 的 赋值 规则 ,可 以 
针对 给 定 算法 A 的 计算 步骤 逐步 对 输入 元 素 赋 值 , 迫 使 算法 在 这 个 输入 下 尽量 做 那些 非 决 定 
性 的 比较 . 算法 的 总 工作 量 就 是 非 决 定性 比较 次 数 加 上 n 一 1( 决 定性 比较 的 次 数 ). 

定理 8.8 设 n 为 奇数 ,任何 通过 比较 运算 找 个 数 的 中 位 数 median 的 算法 在 最 坏 情 
况 下 至 少 做 3n/2 一 3/2 次 比较 . 

证 如 下 定义 决定 性 的 比较 与 非 决 定性 的 比较 . 

决定 性 比较 : 

3 y(x 记 y 且 y 宇 median) ,zx 满足 上 述 条 件 的 第 一 次 比较 ; 

3y(x 二 y 且 y 三 median) ,xz 满足 上 述 条 件 的 第 一 次 比较 ; 

非 决 定性 的 比较 : 当 xz 二 median,y 二 median 时 ,zx 二 y 的 比较 . 

对 于 任意 找 中 位 数 的 算法 A ,根据 算法 A 的 比较 顺序 对 输入 工 的 赋值 规则 如 下 : 

赋值 规则 

(1) 任意 分 配 一 个 值 给 中 位 数 median; 

(2) 如 果 A 比较 zx 与 y 且 zx 与 y 没有 被 赋值 .那么 对 x 和 yy 赋值 使 得 z 二 median， 
y=median; 

(3) 如 果 A 比较 z 与 > 且 z 二 median,y 没 被 赋值 , 则 对 y 赋值 使 得 y 二 median; 

(4) 如 果 A 比较 z 与 > 且 x 二 median,y 没 被 赋值 , 则 对 y 赋值 使 得 > 二 median; 

(5) 如 果 存 在 (n 一 1)/2 个 元 素 已 得 到 小 于 median 的 值 , 则 对 未 赋值 的 元 素 全 部 分 配 
大 于 median 的 值 ; 

(6) 如 果 存在 (n 一 1)/2 个 元 素 已 得 到 大 于 median 的 值 , 则 对 未 赋值 的 元 素 全 部 分 配 
小 于 median 的 值 . 

在 上 述 赋 值 规则 下 ,直到 对 输入 的 赋值 完成 之 前 ,算法 A 所 进行 的 具有 赋值 的 比较 都 
是 非 决 定性 的 . 这 样 的 比较 至 少 有 (zx 一 1)/2 次 .加 上 一 1 次 的 决定 性 比较 ,算法 A 的 比较 
次 数 至 少 为 
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结论 ”Select 算法 的 复杂 度 是 O(n) ,在 阶 上 已 经 达到 最 优 . 
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前 面 的 分 析 已 经 给 出 了 关于 选择 问题 的 算法 类 的 时 间 复 杂 度 的 下 界 ,相关 结果 见 表 8. 6. 
表 8.6 选择 问题 的 时 间 复杂 度 


问 题 算 法 最 坏 情 况 问题 下 界 最 优 性 
找 最 大 Findmax n—1 n—1 最 优 
找 最 大 最 小 FindMaxMin [3n/2 I—2 [3n/2 I—2 最 优 
找 第 二 大 锦标 赛 7 十 [logz | 一 2 ?十 [logz | 一 2 最 优 
找 中 位 数 Select On) 3n/2—3/2 阶 最 优 
找 第 上 小 Select OO n+min{k,n—k+1}—2 阶 最 优 


8.7 通过 归 约 确认 问题 计算 复杂 度 的 下 界 


对 于 一 个 问题 已 ,如 果 想 确认 求解 问题 P 的 任何 算法 所 需要 的 最 少 工作 量 , 即 问题 P 的 
时 间 复 杂 度 的 下 界 , 可 以 考虑 利用 已 知 问题 的 时 间 复 杂 度 来 做 这 件 事 . 设 问 题 Q 的 时 间 复 杂 度 
下 界 是 函数 /(n) ,如 果 可 以 证 明 求 解 问题 P 的 任何 算法 需要 的 工作 量 都 不 小 于 求解 Q 的 算法 
的 工作 量 , 那 么 问题 P 的 时 间 复 杂 度 至 少 是 /(m). 换 句 话说,f(n) 也 是 问题 P 时 间 复杂 度 的 一 
个 下 界 . 这 是 一 种 归 约 (变换 ) 的 方法 . 在 讨论 问题 求解 难度 的 时 候 , 归 约 是 一 种 建立 问题 难度 
层次 的 常用 方法 ,后 面 关 于 计算 复杂 性 理论 的 讨论 会 给 出 大 量 使 用 归 约 方法 的 例子 . 

如 何 建立 问题 P 与 问题 Q 之 间 的 归 约 ? 基本 的 思路 是 : 设计 一 个 求解 Q 的 算法 A, 其 
中 需要 调用 求解 P 的 算法 作为 子 过 程 . 算法 描述 如 下 : 

算法 8.5 求解 Q 的 算法 

输入 : 问题 Q 的 实例 I 

输出 : 实例 工 的 解 

1. 利用 变换 g 将 问题 Q 的 任何 实例 I 转换 成 问题 P 的 实例 g(D (注意 转换 后 的 输入 g(7) 的 规模 应 

该 与 原 问 题 输入 了 的 规模 在 量 级 上 一 致 ) 

2. 利用 求解 问题 P 的 任何 算法 求解 g(7) ,得 到 解 s(g(D)) 

3. 将 s(g(7)) 转 换 成 关于 实例 了 的 解 s (DD) ,输出 

上 述 算法 的 时 间 复 杂 度 是 工 十 Ts 十 T; :其 中 Ti 是 行 1 关于 输入 的 转换 时 间 ,T。 是 行 
2 解 忆 算法 的 运行 时 间 ,T 是 行 3 对 解 的 转换 时 间 . 如 果 T， 和 Ts 相对 于 Ts 是 很 次 要 的 ， 
至 少 阶 与 T; 一 样 ,那么 该 算法 运行 时 间 就 是 Ts ,也 就 是 求解 问题 已 的 任何 算法 的 运行 时 
间 . 由 于 求解 Q 的 算法 类 的 时 间 复 杂 度 的 下 界 是 /(n). 即 任何 解 Q 的 算法 在 最 坏 情 况 下 至 
少 做 /(n) 次 基本 运算 ,因此 T, 至 少 和 f(7) 一 样 大 ,从 而 证 明了 f(nw) 也 是 求解 PP 的 任何 算 
法 的 最 坏 情 况 下 时 间 复 杂 度 的 一 个 下 界 . 
例 8.7 设 有 问题 P 和 Q.P 是 正 整 数 的 素 因 子 分 解 问 题 .输入 是 正 整 数 , 输 出 是 的 
素 因 子 分 解 式 . 问题 Q 是 素数 测试 问题 ,输入 是 正 整 数 n. 输 出 是 “Yes”(n 是 素数 ) 或 “No” 
(n 不 是 素数 ). 下 面 的 归 约 证 明 问题 P 至 少 和 问题 Q 一 样 难 . 

设 Factor 是 任意 的 正 整 数 素 因 子 分 解 算法 ,Factor(z) 等 于 分 解 成 的 全 部 素 因 子 , 如 
Factor(2) 一 {2},Factor(12) 一 (2,2.3}. 规定 Factor(1) 王 1. 算法 8.6 给 出 了 这 两 个 问题 之 
间 的 归 约 . 
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算法 8.6 素数 测试 算法 Test(n) 

输入 : 正 整 数 ” 

输出 : 如 果 ) 是 素数 ,输出 "Yes" ,否则 输出 "No" 
1. if n=l1 then return “No" 

2. else p<—Factor(n) 

3. 让 12| 三 2 then return "No" 
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else return "Yes" 


为 素数 测试 算法 的 输入 与 素 因子 分 解 算法 的 输入 都 是 正 整 数 ”不 需要 输入 的 转换 
操作 ,算法 的 行 1 是 调用 素 因 子 分 解 算法 , 行 2 和 行 3 就 是 条 件 判 定 和 输出 ,只 需要 常数 时 
间 , 因 此 算法 8. 6 的 时 间 复 杂 度 就 是 行 1 的 工作 量 , 即 任何 求解 素 因子 分 解 问题 算法 的 运行 
时 间 . 如 果 已 知 求解 素数 测试 问题 算法 类 的 时 间 复 杂 度 的 下 界 是 /(n) ,那么 Test 算法 的 时 
间 复 杂 度 至 少 是 /(n) ,这 就 意味 着 任何 素 因 子 分 解 算法 的 时 间 复 杂 度 也 不 会 小 于 /(m). 换 
句 话说 , 素 因 子 分 解 问题 至 少 和 素数 测试 问题 一 样 难 . 

例 8.8 考虑 求 平面 上 nn 个 点 的 最 邻近 点 对 问题 的 复杂 度 界定 . 把 这 个 问题 记 作 问题 
P. 问题 Q 是 元 素 唯 一 性 判定 问题 ,该 问题 的 描述 如 下 : 

给 定 nn 个 数 的 集合 S ,判断 S 中 的 元 素 是 否 存 在 相同 元 素 . 可 以 证 明 : 以 元 素 比较 作为 

基本 运算 ， 任何 求解 元 素 唯 一 性 判定 问题 的 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 至 少 是 
(nlogn). 证 明 留 做 习题 . 

如 下 设计 求解 唯一 性 判定 问题 的 算法 : 

算法 8.7 Uniqueness 

输入 : 2 个 数 的 集合 S 

输出 : 如 果 S 中 存在 两 个 数 相等 , 则 输出 "No" ,否则 输出 "Yes" 

1. 将 S 中 的 数 z1 ,x2，… ,zx 转变 成 点 (zl ,0), (za ,0)，…,(Czny0) 

2. 利用 任何 求 最 邻近 点 对 算法 计算 两 点 间 的 最 短 距离 d 
3. if d=0 then return "No" 
4 


. else return "Yes" 


该 算法 的 运行 时 间 主 要 由 行 1 和 行 2 构成 . 行 1 的 工作 量 不 超过 O(n). 行 2 的 工作 量 
就 是 求 最 邻近 点 对 算法 的 工作 量 . 因此 任何 求 最 邻近 点 对 算法 的 时 间 复 杂 度 不 少 于 唯一 性 
判定 问题 的 时 间 复 杂 度 的 下 界 @(nlogn). 

本 章 通过 一 些 例 子 说 明了 界定 问题 (或 算法 类 ) 计 算 复杂 度 下 界 的 一 些 方法 ,这 些 方法 
在 界定 检索 问题 .排序 问题 .选择 问题 的 计算 复杂 度 中 得 到 了 有 效 的 应 用 ,从 而 也 确认 了 相 
应 算法 类 中 最 优 的 算法 是 什么 . 但 是 ,这 些 方法 并 不 总 是 有 效 的 ,对 许多 问题 界定 求解 该 问 
题 的 计算 复杂 度 是 相当 困难 的 ,甚至 找到 一 个 有 效 的 算法 也 不 是 一 件 容易 的 事情 . 而 这 些 问 
题 广泛 存在 于 各 个 应 用 领域 . 后 面 几 章 将 围绕 NP 完全 理论 介绍 计算 复杂 性 理论 的 基本 框 
架 , 希 望 为 处 理 现 实 世 界 的 难 解 问题 给 出 一 些 思路 和 建议 . 


习 题 8 


8.1 设 G = 二 VE>,G: 一 二 VEo> 是 两 个 简单 图 ,其 中 说 一 Vz .假设 G 和 Gi 的 输 
和 人 是 用 邻接 矩阵 表示 的 . 换 句 话 说 ,如 果 (u ,六 ) 是 图 的 边 . 那 么 它 的 邻接 矩阵 M 的 第 
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i 行 第 j 列 的 元 素 rj 二 1; 否 则 ry 二 0,1<i,j<<n. 
(1) 设 输入 规模 是 图 中 的 顶点 数 ,给 出 一 个 算法 判定 Gi 是 否 为 Gs 的 补 图 .说明 算 
法 的 设计 思想 ,并 给 出 最 坏 情况 下 的 时 间 复 杂 度 . 
(2) 对 于 求解 这 个 问题 的 所 有 算法 ,给 出 一 个 尽 可 能 紧 的 时 间 复 杂 度 的 下 界 , 并 证 明 
你 的 结果 . 
对 于 给 定 的 zx 取 0, 求 nn 次 多 项 式 P(z) 二 ao 十 qz 十 azx? 十 … 十 anx" 的 值 . 
(1) 设计 一 个 在 最 坏 情况 下 时 间 复 杂 度 为 9(n) 的 求 值 算法 . 
(2) 证 明 任 何 求 值 算法 的 时 间 复 杂 度 都 是 Q(x). 
(1) 设 A 和 B 是 两 个 长 为 n 的 有 序数 组 ,现在 需要 将 A 与 B 合并 成 一 个 排 好 序 的 数 
组 ,证 明 任 何以 元 素 比 较 作 为 基本 运算 的 归并 算法 至 少 要 做 2" 一 1 次 比较 . 
(2) 对 上 述 归 并 问题 ,假设 |A|==m,1B|==n, 给 出 求解 该 问题 的 最 优 算法 并 证 明 其 最 
优 性 . 
设 n 是 k 的 倍数 ,有 “个 排 好 序 的 数 表 Li ,LL ,… ,Li ,每 个 数 表 都 有 n/k 个 数 . 假设 
nn 个 数 彼此 不 等 ,并 且 归 并 长 为 m,n 的 两 个 数 表 的 时 间 代 价 是 OG 十 训 ). 
(1) 使 用 顺序 归并 算法 归并 这 上 个 数 表 , 在 最 坏 情况 下 的 时 间 复 杂 度 是 什么 ? 
(2) 设计 一 个 时 间 复 杂 度 更 低 的 归并 算法 ,说 明 算 法 的 主要 设计 思想 ,并 分 析 你 的 算 
法 在 最 坏 情况 下 的 时 间 复 杂 度 . 
(3) 对 于 以 比较 作为 基本 运算 求解 上 述 问 题 的 算法 类 ,最 坏 情况 下 的 时 间 复 杂 度 的 下 
界 是 什么 ? 证 明 你 的 结果 . 
求 直 线 点 对 问题 的 一 个 紧 的 下 界 . 
以 二 5 为 例 画 出 冒 泡 排序 算法 的 决策 树 . 
设 A 是 nn 个 不 等 的 整数 按照 递增 次 序 排列 的 数组 ,已 知 存 在 i€ {1,2,…,n) 使 得 
A[ 门 =i, 间 怎样 找到 i 7? 
(1) 设计 一 个 算法 求解 上 述 问题 ,给 出 算法 的 伪 码 描述 并 分 析 算 法 在 最 坏 情况 下 的 时 
间 复 杂 度 . 
(2) 证 明 任 何 求解 上 述 问题 的 算法 至 少 需要 做 Q(logn) 次 比较 . 
设 S 是 个 数 构成 的 数组 ,判断 S 中 的 元 素 是 否 都 是 唯一 的 . 如 果 唯 一 , 则 输出 
“Yes”; 否 则 输出 “No”. 证 明 唯 一 性 判定 问题 的 复杂 度 是 6(nlogn). 
设 工 二 {a1sas，*…,a,) 是 nn 个 不 相等 的 实数 的 数 表 ,m 是 小 于 nn 的 正 整数 . 现在 需要 按 
照 从 小 到 大 的 次 序 输出 工 中 最 小 的 m 个 数 . 
(1) 如 果 mm 二 9(n/logn) ,以 L 中 元 素 的 比较 作为 基本 运算 ,设计 一 个 O(n) 时 间 的 
算法 . 
(2) 如 果 加 二 w(n/1logn) ,证 明 不 存在 O(nw) 时 间 的 算法 . 
证 明 任 何 从 个 数 中 选 第 k& 小 的 数 的 算法 ,如果 以 比较 作为 基本 运算 ,那么 它 至 少 要 
做 nn 十 min{k,n 一 &k 十 1} 一 2 次 比较 . 
给 定 平面 上 7 个 点 的 坐标 . 在 这 些 点 之 间 存在 某 些 边 , 边 (i, 站 的 权 值 是 点 i 和 j 的 距 
离 . 这 些 点 和 边 构 成 平面 上 的 简单 图 G, 求 G 的 一 棵 最 小 生成 树 . 证 明 求 解 该 问题 的 
算法 类 的 时 间 复 杂 度 下 界 是 Q(nlogn). 
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本 章 将 要 介绍 一 类 重要 的 问题 一 一 NP 完全 问题 ,以 及 如 何 识别 这 类 问题 . 大 家 熟知 的 
货 郎 问题 和 背包 问题 就 属于 这 一 类 问题 ,它们 有 成 千 上 万 个 ,分 布 在 图 论 ,数理 逻辑 ,形式 语 
言 与 自动 机 、 运 筹 学 、 人 工 智能 等 各 种 不 同 的 领域 内 ,其 中 有 许多 是 人 们 经 常 可 能 遇 到 的 计 
算 问题 .经 过 数 十 年 的 努力 ,至 今 没 有 找到 求解 它们 的 有 效 算法 ,但 也 没有 能 够 证 明 它们 是 
难 解 的 . 虽然 在 这 些 问题 到 底 是 不 是 难 解 的 方面 没有 取得 实质 性 的 进展 ,而 且 看 来 似乎 变 得 
越 来 越 难 解决 .但 是 ,人 们 在 研究 这 个 问题 时 却 从 另 一 个 角度 开辟 出 一 个 绒 新 的 领域 一 一 计 
算 复杂 性 理论 ,特别 是 NP 完全 性 理论 . 现在 已 经 证 明 , 在 某 种 意义 下 这 些 问题 具有 相同 的 
难度 , 即 如 果 其 中 一 个 有 有 效 算 法 .那么 所 有 这 些 问 题 都 有 有 效 算 法 . 或 者 反 过 来 说 ,如 果 证 
明了 其 中 的 一 个 是 难 解 的 ,那么 所 有 这 些 问题 都 是 难 解 的 . 这 就 是 NP 完全 性 . 算法 研究 人 
员 普 遍 认 为 NP 完全 问题 是 难 解 的 ,一 个 问题 被 证 明 是 NP 完全 的 就 意味 着 这 个 问题 很 可 
能 是 难 解 的 .因而 ,识别 问题 的 NP 完全 性 成 为 算法 工作 者 不 可 缺少 的 能 力 . 而 “NP 完全 问 
题 是 否 真 的 是 难 解 的 ?”, 即 “*P 二 NP?”, 已 成 为 当代 理论 计算 机 科学 和 数学 中 的 一 个 最 重要 、 
最 困难 的 问题 . 

下 面 将 给 出 NP 类 和 NP 完全 问题 及 相关 的 概念 ,介绍 Cook-Levin 定理 一 一 第 一 个 
NP 完全 问题 ,证明 几 个 常见 的 NP 完全 问题 ,并 通过 这 些 证 明说 明证 明 NP 完全 性 的 常用 
方法 . NP 完全 性 理论 是 计算 理论 的 重要 组 成 部 分 ,叙述 相关 概念 和 严格 的 证 明 离 不 开 计算 
模型 ,计算 理论 中 最 基本 、 最 常用 的 计算 模型 是 图 灵机 ,但 这 些 内 容 超 出 本 书 的 范围 和 编写 
本 书 的 初衷. 在 这 里 ,我 们 采用 非 形 式 化 的 方法 ,力求 直观 、 便 于 理解 ,而 又 不 失 准 确 性 . 想 更 
深入 地 了 解 这 部 分 内 容 的 读者 可 参阅 参考 文献 [7]. 


9.1 P 类 与 NP 类 


9.1.1 易 解 的 问题 与 难 解 的 问题 


20 世纪 50 年 代 初 人 们 就 提出 “什么 是 好 算法 ?”, 尽 管 可 以 有 各 种 各 样 评价 算法 的 标 
准 , 但 算法 的 运行 时 间 无 疑 是 最 重要 的 标准 . 前 面 分 析 了 各 种 算法 的 时 间 上 界 , 例 如 ,用 快速 
排序 算法 给 n 个 数据 排序 的 时 间 上 界 为 O(nlogn) ,用 Dijkstra 算法 求解 个 顶点 的 图 的 单 
源 最 短路 径 问 题 的 时 间 上 界 为 OG ), 而 用 回溯 法 解 个 顶点 的 图 的 最 大 团 问题 的 时 间 上 
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界 是 O(z2"). 让 我 们 来 看 这 几 个 算法 运行 时 间 的 区 别 . 假设 我 们 用 一 台 运 行 速度 为 每 秒 
10 亿 次 的 超大 型 计算 机 计算 ,快速 排序 算法 给 10 万 个 数据 排序 的 运算 量 约 为 105 Xlogs 105 < 
1.7X10, 仅 需 1.7X10 /10’ 二 1.7X10 习 秒 , 即 1.7 毫秒 . Dijkstra 算法 求解 1 万 个 顶点 的 
图 的 单 源 最 短路 径 问 题 的 运算 量 约 为 (104) 一 108 , 约 需 108/10? 一 0. 1 秒 . 而 用 回溯 法 解 
100 个 顶点 的 图 的 最 大 团 问 题 的 运算 量 为 100X22% 盖 1.8X102 ,需要 1.8X10%*/10? 一 
1.8X103 秒 . 每 天 有 86 400 秒 , 每 年 是 3. 15 X 107 秒 ,这 是 1. 8 X 102/(3. 15 X 107 ) 一 
5.7X105 年 , 即 5 千 7 百 万 亿 年 ! 再 从 另外 一 个 角度 来 看 一 一 1 分 钟 能 解 多 大 的 问题 .1 分 
钟 60 秒 , 这 台 计 算 机 可 做 6X10” 次 运算 ,用 快速 排序 算法 可 给 2X10*( 即 20 亿 ) 个 数据 排 
序 , 用 Dijkstra 算法 可 解 2.4X105 个 顶点 的 图 的 单 源 最 短路 径 问 题 . 而 用 回溯 法 一 天 只 能 
解 41 个 顶点 的 图 的 最 大 团 问题 . 显然 ,前 两 个 算法 是 快速 的 ,是 好 算法 ,而 解 最 大 团 问题 的 
回溯 法 只 能 用 于 较 小 的 图 ,对 于 稍 大 一 点 的 图 ,如 有 100 个 顶点 的 图 ,这 个 算法 是 根本 不 可 
行 的 . 以 多 项 式 为 时 间 上 界 的 算法 称 作 多 项 式 时 间 算 法 ,快速 排序 和 Dijkstra 算法 都 是 多 项 
式 时 间 算 法 . 正如 上 面 看 到 的 ,由 于 多 项 式 一 一 特别 是 低 次 多 项 式 , 如 n,m 随 自 变 量 
的 增长 而 增长 的 速度 比较 缓慢 ,而 指数 函数 是 典型 的 非 多 项 式 函 数 , 它 随 着 自 变 量 的 增长 而 
迅速 增长 , 即 所 谓 的 指数 爆炸 ,因而 我 们 认为 多 项 式 时 间 算 法 是 好 算法 ,有 多 项 式 时 间 算 法 
的 问题 是 易 解 的 ,而 不 存在 多 项 式 时 间 算法 的 问题 是 难 解 的 . 

为 了 更 准确 地 叙述 这 些 概念 ,下 面 给 出 时 间 复 杂 度 及 其 相关 的 概念 . 

先 要 给 出 两 个 函数 多 项 式 相关 的 概念 . 设 /,g :NN, 如 果 存 在 多 项 式 p 和 g ,使 得 对 任 
意 的 nEN,f() 三 pl(g (4m)) 和 gn) 三 q(f(n)), 则 称 函 数 /和 gg 是 多 项 式 相关 的 . 例如 ， 
nlogn 与 22 ,1 十 2n 十 5 与 na" 都 是 多 项 式 相 关 的 ,而 logn 与 n.ni 与 2" 不 是 多 项 式 相 关 的 ， 

定义 9.1 设 A 是 求解 问题 工 的 算法 ,在 用 A 求解 工 的 实例 I 时 ,首先 要 把 I 编码 成 
二 进 制 的 字符 串 作 为 A 的 输入 , 称 了 的 二 进 制 编码 的 长 度 为 1 的 规模 , 记 作 11|. 如 果 存 在 函 
数 f:N-~N 使 得 ,对 任意 的 规模 为 n 的 实例 I,A 对 了 的 运算 在 /(n) 步 内 停止 , 则 称 算法 A 
的 时 间 复 杂 度 为 /(n). 以 多 项 式 为 时 间 复 杂 度 的 算法 称 作 多 项 式 时 间 算 法 . 有 多项式 时 间 
算法 的 问题 称 作 易 解 的 . 不 存在 多 项 式 时 间 算 法 的 问题 称 作 难 解 的 . 

对 上 述 概念 需要 做 如 下 的 进一步 解释 .实例 工 的 规模 与 所 采用 的 编码 方式 有 关 . 例如 ， 
设 实 例 工 是 一 个 无 向 简单 图 G, 如 G 一 <V,E>> ,其 中 V 一 (abcyd),E 一 ((o,0) ,Cascd)， 
(bo,c),(O,d), (cd)), 若 用 邻接 矩阵 表示 , 则 了 工 可 编码 成 el 一 0101/1011/0101/1110/ ,长 度 
为 20. 若 用 关联 答 阵 表 示 , 则 了 可 编码 成 es 二 11000/10110/00101/01011/, 长 度 为 24. 
设 G 有 nn 个 顶点 m 条 边 , 则 用 邻接 和 矩阵 时 |T| 二 n(n 十 1), 用 关联 答 阵 时 |T| 二 n(m 十 1). 注 
意 到 mm 二 n(n 一 1)/2, 这 两 种 编码 的 长 度 是 多 项 式 相 关 的 . 一 般 地 , 当 采 用 合理 的 编码 时 , 输 
入 的 规模 都 应 该 是 多 项 式 相 关 的 . 这 里 “合理 的 ”一 词 是 指 在 编码 中 不 故意 使 用 许多 宛 余 的 
字符 . 另 一 个 需要 强调 的 是 采用 二 进 制 编码 . 自然 数 1 的 二 进 制 编码 有 [logs(n 十 1) | 位 ,而 它 
的 一 进 制 编码 有 nn 位 ,两 者 不 是 多 项 式 相 关 的 . 因此 ,我 们 的 编码 不 能 采用 一 进 制 .但 可 以 采 
用 任意 的 进 制 ,其 中 尺 是 大 于 等 于 2 的 正 整 数 . 当 k 宇 2 时 ,k 进 制 编码 的 长 度 与 二 进 制 编 
码 的 长 度 相差 不 超过 [log* A | 信 . 

前 面 在 估计 算法 的 运算 量 时 都 是 把 它 表 示 成 计算 对 象 的 某 些 自然 参数 的 函数 ,如 图 的 
顶点 数 或 顶点 数 与 边 数 的 函数 . 实际 上 ,这 些 实例 的 二 进 制 编码 的 长 度 与 这 些 参 数 都 是 多 项 
式 相 关 的 ,从 而 也 可 以 直接 用 这 些 参 数 作 为 实例 的 规模 . 
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关于 操作 指令 集 有 两 点 需要 说 明 . 其 一 ,执行 不 同 的 指令 所 用 的 时 间 是 不 同 的 ,但 在 这 
里 把 执行 任何 一 条 指令 作为 一 步 . 这 就 要 求 操作 指令 集中 的 每 一 条 指令 都 是 “合理 的 ”指令 ， 
即 要 求 每 一 条 指令 的 执行 时 间 是 固定 的 常数 . 对 于 这 种 “合理 的 ”操作 指令 集 ,算法 的 计算 步 
数 与 运行 时 间 至 多 相差 常数 倍 .例如 ,两 个 长 度 不 超过 规定 长 度 (计算 机 的 字 长 ) 的 二 进 制 数 
的 加 法 是 一 条 合理 的 指令 . 注意 ,这 个 二 进 制 加 法 不 是 两 个 长 度 任意 的 二 进 制 数 相 加 ,对 于 
超过 计算 机 字 长 的 整数 加 法 必须 进行 分 段 处 理 , 而 不 再 看 作 一 条 合理 的 指令 .其 二 ,算法 的 
计算 步 数 与 采用 的 操作 指令 集 有 关 . 但 实际 上 对 于 任何 两 个 “合理 的 ”操作 指令 集 , 其 中 一 个 
旨 令 集 中 的 每 一 条 指令 都 可 以 用 另 一 个 指令 集中 的 指令 模拟 , 且 模 拟 所 用 的 指令 条 数 不 超 
过 某 个 固定 的 常数 ,从 而 同一 个 算法 在 任何 两 个 “合理 的 ”操作 指令 集 上 的 运算 步 数 至 多 相 
差 常数 倍 . 为 了 进一步 明确 “合理 的 ”一 词 的 含义 ,可 以 规定 一 个 基本 操作 指令 集 ,如 它 由 位 
逻辑 运算 与 或、 非 组 成 ,然后 认为 任何 可 以 用 这 个 基本 操作 指令 集中 常数 条 指令 实现 的 操 
作 都 是 合理 的 指令 ,由 有 限 种 合理 的 指令 构成 的 操作 指令 集 是 合理 的 操作 指令 集 . 

上 述 约定 是 符合 实际 情况 的 ,因而 是 合理 的 . 在 这 样 的 约定 下 ,算法 是 否 是 多 项 式 时 间 
与 采用 的 输入 编码 和 操作 指令 集 无 关 , 从 而 一 个 问题 是 易 解 的 还 是 难 解 的 也 与 采用 的 输入 
编码 和 操作 指令 集 无 关 . 事实 上 , 设 有 两 种 编码 m .as 和 两 个 操作 指令 集 Di 、Ds. 实例 了 的 
这 两 种 编码 的 长 度 分 别 记 作 |I|! 和 |T|,. 根据 假设 ,存在 多 项 式 p 和 9g, 使 得 对 任意 的 实例 
IT, 有 |Il1 志 p(Tls) 和 |I|。 二 gq(|1|1). 又 存在 常数 kl 和 ks, 使 得 Di 中 的 每 一 条 指令 都 可 以 
用 Ds 中 的 不 超过 所 条 指令 模拟 ,Di 中 的 每 一 条 指令 都 可 以 用 Di 中 的 不 超过 ks 条 指令 模 
拟 . 设 算法 A 在 采用 编码 ai 和 操作 指令 集 Di 时 是 多 项 式 时 间 的 , 即 存在 多 项 式 /使 得 对 
任意 的 实例 I, 算 法 在 /(|11|1) 步 内 停止 . 不 妨 设 / 是 单调 递增 的 . 若 采用 操作 指令 集 D,, 算 
法 至 多 运行 如 /CITI1) 步 .又 ,RACITI1D) 志 如 Cp(1Tls)),f(p(n)) 也 是 多 项 式 ,从 而 得 证 AA 
在 采用 编码 as 和 操作 指令 集 Ds 时 也 是 多 项 式 时 间 的 . 由 对 称 性 , 若 算法 A 在 采用 编码 os 
和 操作 指令 集 Ds 时 是 多 项 式 时 间 的 ,那么 在 采用 编码 ol 和 操作 指令 集 Di 时 也 是 多 项 式 时 
间 的 . 因此 ,算法 A 是 否 是 多 项 式 时 间 的 与 采用 的 输入 编码 和 操作 指令 集 无 关 . 

前 面 几 章 已 经 给 出 排序 、 最 小 生成 树 , 单 源 最 短路 径 等 问题 的 多 项 式 时 间 算 法 ,因此 它 
们 都 是 易 解 的 . 现在 也 已 经 证 明了 一 些 问 题 是 难 解 的 . 在 已 证 明 的 难 解 问题 中 ,一 类 是 不 可 
计算 的 , 即 根本 不 存在 求解 的 算法 .如 丢 番 图 方程 是 否 有 整数 解 , 即 任意 的 整 系数 多 元 代数 
方程 是 否 有 整数 解 , 这 就 是 著名 的 希 尔 伯 特 第 十 问题 . 这 是 一 类 在 特别 强 的 意义 下 难 解 的 问 
题 . 除了 这 类 问题 外 ,在 数理 逻辑 .形式 语言 与 自动 机 理论 .组 合 游戏 等 领域 内 已 经 找到 一 些 
问题 ,它们 都 有 算法 ,但 至 少 需 要 指数 时 间 , 有 的 至 少 需要 指数 空间 ,甚至 更 多 的 时 间或 更 大 
的 空间 ,它们 都 是 难 解 的 . 

但 是 , 难 办 的 是 人 们 发 现 包括 哈 密 顿 回路 问题 、 货 郎 问题 .背包 问题 等 在 内 的 一 大 批 问 
题 既 没有 找到 它们 的 多 项 式 时 间 算 法 、 又 没 能 证 明 它们 是 难 解 的 . 由 于 这 些 问题 不 仅 数量 庞 
大 、 分 布 广泛 ,而且 其 中 许多 是 在 各 个 领域 中 经 常 遇 到 的 重要 问题 ,因而 这 些 问 题 的 难度 成 
为 人 们 十 分 关心 的 问题 . 本 章 的 任务 就 是 要 给 出 刻画 这 类 问题 的 难度 的 方法 . 


9.1.2 判定 问题 


由 于 技术 上 的 原因 ,在 定义 复杂 性 类 时 限制 在 判定 问题 上 . 所 谓 判定 问题 是 指 答案 只 有 
两 个 一 一 是 "和 “ 否 ”, 或 者 "Yes”" 和 “No” 一 一 的 问题 . 形式 上 ,判定 问题 卫 可 定义 为 有 序 对 
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二 Dun,Yun 记 ,其 中 Dr 是 实例 集合 ,由 荆 的 所 有 可 能 的 实例 组 成 ;Yn 守 Dr 由 所 有 答案 为 
“Yes” 的 实例 组 成 . 例如 : 

哈密 顿 回路 (HC) : 任 给 无 向 图 G, 问 G 是 哈密 顿 图 吗 ? 所 谓 哈密 顿 图 是 指 图 中 有 恰好 
经 过 每 一 个 顶点 一 次 的 回路 ,这 样 的 回路 称 作 哈密 顿 回路 . 

这 是 一 个 判定 问题 ,其 中 Dac 由 所 有 的 无 向 图 组 成 ,而 Yac 包 括 所 有 哈密 顿 图 . 不 过 要 
注意 ,在 这 里 仅仅 问 是 否 是 哈密 顿 图 , 即 图 中 是 否 有 一 条 哈密 顿 回 路 ,并 不 要 求 给 出 这 样 的 
回路 . 在 实际 中 ,这 类 问题 通常 以 搜索 问题 的 形式 出 现 , 即 要 寻找 一 条 哈密 顿 回 路 . 当 G 是 
哈密 顿 图 时 ,要求 给 出 它 的 一 条 哈密 顿 回 路 ; 当 不 是 哈密 顿 图 时 , 则 输出 “No”. 我 们 称 它 为 
判定 问题 HC 对 应 的 搜索 问题 . 

如 果 判 定 问题 HC 对 应 的 搜索 问题 有 多 项 式 时 间 算 法 A, 任 给 一 个 无 向 图 G, 当 G 是 哈 
密 顿 图 时 ,A 输出 G 的 一 条 哈密 顿 回 路 ; 当 G 不 是 哈密 顿 图 时 ,A 输出 *No”. 那么 ,可 以 利用 
A, 构 造 如 下 HC 的 算法 B: 对 任 给 的 无 向 图 G, 运 用 算法 A, 如 果 A 输出 G 的 一 条 哈密 顿 回 
路 , 则 B 输 出 *Yes”; 如 果 A 输出 “No”, 则 B 输 出 “No”. 显然 ,B 也 是 多 项 式 时 间 的 . 这 表 
明 ,如果 HC 对 应 的 搜索 问题 是 易 解 的 , 则 HC 也 是 易 解 的 . 反 过 来 说 ,如 果 HC 是 难 解 的 , 则 
它 对 应 的 搜索 问题 也 是 难 解 的 . 在 这 个 意义 上 ,判定 问题 HC 对 应 的 搜索 问题 不 会 比 HC 本 
身 容易 ; 反 过 来 ,HC 不 会 比 它 对 应 的 搜索 问题 难 . 

组 合 优化 是 经 常 遇 到 的 一 大 类 计算 问题 ,如 前 面 讲 过 的 最 短路 径 问 题 和 货 郎 问题 . 和 搜 
索 问题 类 似 , 组 合 优化 问题 和 判定 问题 之 间 也 有 类 似 的 关系 . 货 郎 问题 的 判定 形式 如 下 : 

货 郎 问题 (TSP): 任 给 个 城市 ,城市 i 与 城市 j 之 间 的 正 整数 距离 d (i,j),i 关 j， 
1<i,j 二 nn, 以 及 正 整数 DD, 问 有 一 条 每 一 个 城市 恰好 经 过 一 次 最 后 回 到 出 发 点 且 长 度 不 超 
过 D 的 巡回 路 线 吗 ? 即 , 是 否 存 在 1,2,…,n 的 排列 o 使 得 


nl 


Dado ,odit+1)) + den) ,ol1)) <D 


前 面 研究 过 的 TSP 的 优化 形式 则 要 求 给 出 一 条 这 种 长 度 最 短 的 巡回 路 线 . 与 HC 类 似 ， 
如 果 TSP 的 优化 形式 有 多 项 式 时 间 算 法 A, 那 么 可 以 如 下 构造 判定 问题 TSP 的 算法 B: 对 
任 给 的 实例 工 ,应 用 A 求 出 长 度 最 短 的 巡回 路 线 ,计算 这 条 路 线 的 长 度 d, 并 与 DD 比较. 如果 
d 壹 DD, 则 B 输 出 "Yes”; 否 则 输出 "*No”. 显然 ,B 也 是 多 项 式 时 间 的 . 于 是 ,这 同样 表明 ,如 果 
TSP 是 难 解 的 , 则 它 的 优化 形式 也 是 难 解 的 . 或 者 说 ,TSP 的 优化 形式 不 会 比 TSP 容易 . 

又 如 ,在 第 3 章 介 绍 的 最 长 公共 子 序列 问题 是 最 大 化 问题 , 它 对 应 的 判定 形式 如 下 ， 

最 长 公共 子 序 列 : 任 给 两 个 序列 X 王 二 ziyzz ,yz 二 和 YY 一 一 yy ,yw 二 ,以 及 
正 整 数 氏 , 问 存在 X 和 立 长 度 不 小 于 开 的 公共 子 序列 吗 ? 

和 上 面 类 似 , 不 难 利用 最 长 公共 子 序列 问题 的 多 项 式 时 间 算 法 设计 出 求解 它 的 判定 形 
式 最 长 公共 子 序列 的 多 项 式 时 间 算 法 : 首先 求 出 X 和 YY 的 最 长 公共 子 序列 Z, 然 后 计算 
Z 的 长 度 |Z| ,如 果 |Z| 三 K 则 输出 “Yes”, 否 则 输出 “No”. 和 前 面 两 个 问题 不 同 的 是 ,最 长 
公共 子 序列 问题 确实 有 多 项 式 时 间 算 法 ,如 在 第 3 章 给 出 的 算法 LCS, 从 而 最 长 公共 子 序列 
也 是 易 解 的 . 

一 般 地 .组 合 优化 问题 I* 由 3 部 分 组 成 : 

(1) 实例 集 Da* ; 

(2) 对 每 一 个 实例 TE Da* ,有 一 个 有 穷 的 非 空 集合 S(D ,SCD) 的 元 素 称 作 工 的 可 行 解 ; 
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(3) 对 每 一 个 可 行 解 :SE S(T) ,有 一 个 正 整 数 c(s) . 称 作 * 的 值 . 
当 I’* 是 最 小 化 问题 (最 大 化 问题 ) 时 .如果 s* € S( 了 TD) 使 得 对 所 有 的 ;€ S(7)， 
CO Ns EC (EG "7 = 

则 称 s* 是 了 的 最 优 解 ,c(s* ) 是 工 的 最 优 值 , 记 作 OPT(D. 

对 应 "的 判定 问题 了 = 二 Dy ,Ys 二 定义 如 下 : Ds 二 {(1,K)|IE Da* ,KEZ* ) ,其 中 2 
是 非 负 整数 集合 . 当 I 是 最 小 化 问题 时 ,Yr 二 {1(1,K)|1OPT(D 三 K}; 当 I 是 最 大 化 问题 时 ， 
Yr 二 {(1,K)1OPT(D 宇 K}). 即 ,对 I 的 每 一 个 实例 了 ,添加 一 个 非 负 整数 K 得 到 工 的 一 个 实 
例 了 , 当 工 * 是 最 小 化 问题 (最 大 化 问题 ) 时 , 问 7 有 一 个 可 行 解 ;SE S(D) 的 值 c(s) 小 于 等 于 (大 
于 等 于 )K 吗 ? 也 就 是 说 ,7 的 答案 是 ”Yes” 当 且 仅 当 OPT(DK(OPT(D 宇 RK). 

不 难 套用 前 面 的 方法 证 明 , 只 要 可 行 解 的 值 c(*) 是 多 项 式 时 间 可 计算 的 ,那么 ,如 果 判 
定 问题 了 是 难 解 的 , 则 对 应 的 优化 问题 了 也 是 难 解 的 . 事实 上 ,通常 还 可 以 证 明 反 过 来 也 
是 对 的 ,如 果 优 化 问题 I" 是 难 解 的 , 则 对 应 的 判定 问题 瑟 也 是 难 解 的 . 即 ,判定 问题 工 与 它 
对 应 的 优化 问题 了 * 具有 相同 的 难度 . 由 此 可 见 ,当下 面 把 研究 的 对 象限 制 在 判定 问题 的 时 
候 , 所 得 到 的 结果 不 难 引 申 到 对 应 的 搜索 问题 或 组 合 优化 问题 . 


9.1.3 NP 类 


定义 9.2 所 有 多 项 式 时 间 可 解 的 判定 问题 组 成 的 问题 类 称 作 P 类. 

例如 ,最 长 公共 子 序 列 EP. 根据 前 面 的 叙述 ,一 个 判定 问题 是 易 解 的 当 且 仅 当 它 属 于 
P 类 . 现在 的 问题 是 ,前 面 所 说 的 包括 哈密 顿 回 路 问题 . 货 郎 问题 .背包 问题 等 在 内 既 没有 找 
到 多 项 式 时 间 算 法 、 又 没 能 证 明 是 难 解 的 一 大 类 问题 所 对 应 的 判定 问题 有 什么 样 的 难度 . 对 
于 这 些 判定 问题 虽然 我 们 既 没 能 证 明 它 们 属于 了 .也 没 能 证 明 它 们 不 属于 了 ,但 是 却 发 现 它 
们 有 一 个 共同 的 特点 一 一 是 多 项 式 时 间 可 验证 的 . 例如 ,对 于 哈密 顿 回 路 , 任 给 一 个 无 向 图 
G, 如 果 有 一 位 能 力 超 强 的 人 声称 G 是 哈密 顿 图 ,并 且 提供 了 一 条 回路 二 ,说 这 是 G 中 的 一 
条 哈密 顿 回 路 ,从 而 证 明 他 说 的 是 对 的 .那么 ,我 们 很 容易 在 多 项 式 时 间 内 检查 工 是 不 是 G 
中 的 哈密 顿 回路 ,从 而 验证 他 说 的 是 否 是 对 的 . 而 且 当 G 是 哈密 顿 图 时 ,由 于 他 的 能 力 超 
强 , 总 能 够 提供 一 条 这 样 的 回路 工 (不 管 他 是 怎么 找到 的 ). 把 这 个 思想 抽象 成 下 述 概念 . 

定义 9.3 设 判 定 问题 了 == 二 D.,Y 放 ,如 果 存 在 两 个 输入 变量 的 多 项 式 时 间 算 法 A 和 
多 项 式 p ,对 每 一 个 实例 TE D.IEY 当 且 仅 当 存在 t,t| 三 p(111), 且 A 对 输入 I 和 +t 输出 
“Yes”, 则 称 卫 是 多 项 式 时 间 可 验证 的 ,A 是 了 的 多 项 式 时 间 验 证 算法 ,而 当 ITEY 时 ， 
称 t 是 TEY 的 证 据 . 

由 所 有 多 项 式 时 间 可 验证 的 判定 问题 组 成 的 问题 类 称 作 NP 类 . 

NP 是 非 确定 型 多 项 式 (nondeterministic polynomial) 的 缩写 . 可 以 把 多 项 式 时 间 验 证 
算法 看 成 用 下 述 不 确定 的 方式 搜索 整个 可 能 的 证 据 空 间 : 对 给 定 的 实例 1, 首先 “猜想 ”一 个 1， 
li| 夺 p(11|), 然 后 检查 1 是否 是 证 明 TEY 的 证 据 . 猜 想 和 检查 可 以 在 多 项 式 时 间 内 完成 ,并 
且 当 且 仅 当 TEY 时 能 够 正确 地 猜想 到 一 个 证 据 t. 这 种 不 确定 的 搜索 方式 称 作 非 确定 型 多 
项 式 时 间 算 法 . 判定 问题 IE NP 当 且 仅 当 开 存 在 非 确 定型 多 项 式 时 间 算 法 . 相对 应 地 ， 
通常 的 算法 称 作 确定 型 算法 . 要 注意 的 是 . 非 确 定型 算法 并 不 是 真正 的 算法 , 它 仅 是 为 了 刻 
画 可 验证 性 而 提出 的 一 种 概念 .为 了 把 非 确定 型 多 项 式 时间 算 法 转换 成 确定 型 算法 ,必须 搜 
索 整 个 可 能 的 证 据 空 间 , 这 通常 需要 指数 时 间 . 
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对 于 哈密 顿 回 路 可 以 如 下 设计 非 确定 型 多 项 式 时 间 算 法 : 任 给 无 向 图 G, 任 意 猜想 所 


有 顶点 的 一 个 排列 ,然后 检查 这 个 排列 是 否 构成 一 条 哈密 顿 回路 . 即 相 邻 两 个 顶点 之 间 以 及 
首尾 两 个 顶点 之 间 是 否 都 有 边 . 若是 , 则 回答 "Yes”, 否 则 回答 “No”. 当 无 向 图 G 是 哈密 顿 


图 时 ,总 能 猜 对 一 个 排列 , 它 确实 给 出 一 条 哈密 顿 回路 ,从 而 算法 回答 “Yes”. 如 果 G 不 是 哈 
密 顿 图 , 则 猜想 的 任何 排列 都 不 是 哈密 顿 回路 ,从 而 算法 总 是 回答 “No”. 猜想 一 个 排列 并 检 
查 这 个 排列 是 否 是 哈密 顿 回路 显然 可 以 在 多 项 式 时 间 内 完成 . 因此 ,HCE NP. 任何 一 个 构 
成 哈密 顿 回路 的 顶点 排列 都 是 G 为 哈密 顿 图 的 证 据 . 又 如 0-1 背包 问题 。 

0-1 背包 : 任 给 nn 件 物 品 和 一 个 背包 ,物品 i 的 重量 为 w; ,价值 为 v;,1 志 i<<n, 以 及 背包 
的 重量 限制 B 和 价值 目标 K ,其 中 vw; ,wi,B,K 均 为 正 整数 , 问 能 在 背包 中 装 入 总 价值 不 少 
于 KK 且 总 重量 不 超过 B 的 物品 吗 ? 即 ,存在 子 集 TSE{11,2,…:,z)} 使 得 
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和 全 iET 

在 第 5 章 介 绍 过 这 个 问题 的 优化 形式 的 算法 . 显然 能 够 在 多 项 式 时 间 内 任意 猜想 
全,2,…,n) 的 一 个 子 集 并 检查 这 个 子 集 是 否 满足 上 述 两 个 不 等 式 , 从 而 正确 地 回答 “Yes” 
或 “No”. 这 是 0-1 背包 的 非 确 定型 多 项 式 时 间 算 法 , 故 0-1 背包 ENP. 

问题 卫 王 二 D,Y>ENP 的 关键 在 于 , 当 实例 TEY 时 有 便于 检查 的 简短 证 据 . 

哈密 顿 回路 .0-1 背包 属于 NP, 最 长 公共 子 序列 也 属于 NP. 事实 上 ,P 和 NP 有 下 述 关 系 ， 

定理 9.1 PENP. 

证 设 了 = 二 D,Y>EP,A 是 世 的 多 项 式 时 间 算 法 . 实际 上 A 也 是 五 的 多 项 式 时 间 验 
证 算法 ,这 只 需要 把 A 看 成 两 个 输入 变量 的 算法 ,而 实际 上 不 管 第 二 个 输入 变量 的 值 . 更 形 
式 地 ,如 下 构造 算法 B: 对 每 一 个 TE D 和 任意 的 1.B 对 I\t 的 计算 与 A 对 了 的 计算 完全 一 
样 ,而 不 管 1. 显然 ,B 是 多 项 式 时 间 的 . 当 IEY 时 , 取 某 个 固定 的 to 作为 第 二 个 输入 ,如 取 
to 二 1, 由 于 A 对 了 T 的 输出 是 *Yes”,B 对 Tto 的 输出 也 是 "Yes”; 当 IKY 时 ,对 任意 的 1， 
于 A 对 了 的 输出 是 “No”,B 对 Tt 的 输出 也 是 “No”. 因此 ,已 是 区 的 多 项 式 时 间 验 证 算法 ， 
得 证 TE NP. 

现在 的 问题 是 P= 二 NP 吗 ? 也 就 是 说 ,NP 中 有 难 解 的 问题 吗 ? 


9.2 多 项 式 时 间 变 换 与 NP 完全 性 


9.2.1 多 项 式 时 间 变 换 


由 于 对 NP 中 的 许多 问题 经 过 努力 始终 没有 找到 多 项 式 时 间 算 法 ,也 没 能 证 明 是 难 解 
的 ,因此 人 们 只 得 另辟蹊径 . 如 果 NP 中 有 难 解 的 问题 ,那么 NP 中 最 难 的 问题 一 定 是 难 解 
的 .什么 是 最 难 的 问题 ? 如 何 描述 最 难 的 问题 ? 这 就 需要 比较 问题 之 间 的 难度 . 为 此 ,引入 
下 述 概念 . 

定义 9.4 设 判 定 问题 五 = 二 Di .六 请 .于 二 二 D; ,Y; 请 .如 果 函 数 / :Di 一 D; 满足 条 件 : 

(1) 了 是 多 项 式 时 间 可 计算 的 , 即 存在 计算 f 的 多 项 式 时 间 算 法 . 

(2) 对 所 有 的 TE Di ,TEY1 信 f(D) EY;. 
则 称 /是 工 到 I 的 多 项 式 时 间 变 换 . 

如 果 存 在 五 到 五 的 多 项 式 时 间 变 换 ,. 则 称 瑟 可 多 项 式 时 间 变 换 到 五 . 记 作 芽 志 ,1;. 
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例 9.1 HC<,TSP. 
证 ”如 下 规定 HC 到 TSP 的 多 项 式 时间 变 换 f. 对 HC 的 每 一 个 实例 1,T 是 一 个 无 向 图 
G 一 二 V,E>> :TSP 对 应 的 实例 /( 了 为 : 城市 集 V ,任意 两 个 不 同 的 城市 w 和 w 之 间 的 距离 
1 车 (u,v) EE 
2 否则 


以 及 界限 D==1V1. 显然 ,f 是 多 项 式 时 间 可 计算 的 ,又 /( 了 7) 中 每 一 个 城市 恰好 经 过 一 次 的 
巡回 路 线 有 IV| 条 边 , 每 条 边 的 长 度 为 1 或 2, 因 而 巡回 路 线 的 长 度 至 少 等 于 D. 于 是 ,巡回 
路 线 的 长 度 不 超过 DD, 实际 上 恰好 等 于 D, 这 当 且 仅 当 它 的 每 条 边 的 长 度 都 为 1, 又 当 且 仅 
当 它 是 G 中 的 一 条 哈密 顿 回 路 ,从 而 TE€Yhc 今 1(1) EYzrsp. 

在 第 4 章 中 介绍 了 最 小 生成 树 问题 , 它 对 应 的 判定 问题 如 下 : 

最 小 生成 树 : 任 给 连通 的 无 向 赋 权 图 G= 二 二 V ,E,W 放 , 其 中 权 W:E>Zt+ ,以 及 正 整 数 
B, 问 有 权 不 超过 B 的 生成 树 吗 ? 

它 的 对 偶 问 题 是 最 大 生成 树 , 定 义 如 下 : 

最 大 生成 树 : 任 给 连通 的 无 向 赋 权 图 G 二 二 V ,E,W 记 , 其 中 权 W:E>Zt+ ,以 及 正 整 数 
DD, 问 G 有 权 不 小 于 DD 的 生成 树 吗 ? 

例 9.2 最 大 生成 树 三 , 最 小 生成 树 . 

证 ”对 最 大 生成 树 的 每 一 个 实例 1,T 是 一 个 连通 的 无 向 赋 权 图 G 二 二 V ,E,W 这 和 正 
整数 马 , 其 中 权 W:E>Z*+ .如 下 构造 最 小 生成 树 的 对 应 实例 /( 了 1) : 连通 的 无 向 赋 权 图 G 一 
二 V,E,W' 这 和 正 整 数 B=(n 一 1)M 一 D, 其 中 n=|V|,M==max{W(e)|eEE) 十 1, 对 每 一 
条 边 eE€EE,W'(e) 二 M 一 W(e). 

显然 / 是 多 项 式 时 间 可 计算 的 ,要 证 I 是 Yes” 实例 当 且 仅 当 /( 了 ) 是 “Yes” 实 例 . 假设 
I 是 “Yes” 实 例 ,那么 存在 G 的 生成 树 工 .使 得 

> W(e) =D 
ET 


d(u,v) = 


根据 A( 了 的 构造 和 |T| 二 n 一 1, 有 
OW) = >)C(M 一 页 (o) = a DM DW) Sm—D DM-D=B 
ET se ET 


即 ,TT 是 G' 中 权 不 超过 B 的 生成 树 , 从 而 /( 了 ) 是 “Yes” 实 例 . 反 过 来 可 类 似 证 明 , 得 证 /是 
最 大 生成 树 到 最 小 生成 树 的 多 项 式 时 间 变 换 . 

下 面 给 出 硅 , 的 性 质 . 

定理 9.2 三 , 具有 传递 性 . 即 , 设 正 委 ,IT ,IH 二 I;; 则 芽 志 ,I1;. 

证 役 卫 二 <D 六 = 于 D 玉 二 二 攻守 和 8 分别 是 压 到 王 和 
I 到 I 的 多 项 式 时 间 变 换 . 对 每 一 个 IEDi. 令 hh(D) 二 g(f(D)). 即 ,hh 是 f 和 g 的 复合 .要 
证 是 I 到 1 的 多 项 式 时 间 变换 . 

设 算法 A 和 B 分 别 计算 了 和 g .它们 的 时 间 上 界 分 别 为 多 项 式 p 和 9g, 不 妨 设 p 和 
g 是 单调 递增 的 . 如 下 构造 计算 h 的 算法 C: 对 每 一 个 TE Di ,首先 对 了 应 用 A. 得 到 输出 
f(D ;再 将 FT 作为 也 的 输入 ,计算 得 到 /CD 一 gsCFCD).A 对 输入 了 的 计算 步 数 不 超过 
p(T1),B 对 输入 /(7) 的 计算 步 数 不 超 过 g(|1f(7)1). 于 是 ,C 对 输入 了 的 计算 步 数 不 超过 
p(T1) 十 ga(|1 了 (D1). 注意 到 ,输出 作为 合理 的 指令 .一 步 只 能 输出 长 度 不 超过 固定 值 的 字 
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符 串 ,因而 |f(D1kp(1T1), 其 中 是 一 个 常数 .于 是 ,p(1T1) 十 q(| f(D1) 夺 p(T|) 十 
g(kp(1T1)), 这 是 117| 的 多 项 式 , 从 而 h 是 多 项 式 时 间 可 计算 的 . 

又 对 每 = 个 TED， 

ee WWE Bop € WE 设 

得 证 hh 是 了 到 II 的 多 项 式 时 间 变 换 . 

定理 9.3 设 卫 二 ,I;, 则 EP 蕴涵 IL EP. 

证 设 下 = 二 Di ,六 二 ,正二 二 D:,y: 二 ,上 是 并 到 兢 的 多 项 式 时 间 变 换 ,A 是 计算 
y 的 多 项 式 时 间 算 法 . 又 设 已 是 也: 的 多 项 式 时 间 算 法 . 如 下 构造 苏 的 算法 C: 对 每 一 个 
TE Di ,首先 应 用 A 得 到 太 CD ,然后 对 /( 了 ) 应 用 B,C 输出 *Yes” 当 且 仅 当 B 输 出 "Yes”. 

要 证 C 是 I 的 算法 .对 每 一 个 I€EDi， 

TE YS f(D EY 人 SB 对 /f(D 输出 *Yes” 今 C 对 I 输出 “Yes” 

故 C 是 了 的 算法 . 

类 似 定 理 9. 2 的 证 明 , 可 以 证 明 算法 C 是 多 项 式 时 间 的 . 得 证 I EP. 

下 面 是 定理 9. 3 的 另 一 种 表述 . 

推论 9.1 设 卫 三 ,I ,那么 , 若 了 五 是 难 解 的 , 则 I 也 是 难 解 的 . 

在 第 4 章 已 经 证 明 最 小 生成 树 EP, 由 定理 9. 3 和 例 9. 2 得 到 最 大 生成 树 EP. 由 推 
论 9.1 和 例 9.1, 如 果 HC 是 难 解 的 , 则 TSP 也 是 难 解 的 . 

定理 9.3 及 其 推论 9. 1 表明 ,三 , 提供 了 比较 判定 问题 之 间 难 度 的 手段 一 一 如 果 
本 志 II;, 则 相对 于 多 项 式 时 间 ,IL 不 会 比 全 容易 ,或 者 反 过 来 说 ,下 不 会 比 下 难 . 其 实在 
9.1.1 节 中 已 经 做 了 这 件 工作 ,在 那里 证 明了 判定 问题 不 会 比 对 应 的 组 合 优化 问题 或 搜索 
问题 更 难 . 所 采用 的 方法 是 利用 组 合 优化 问题 或 搜索 问题 的 算法 A 构造 对 应 的 判定 问题 的 
算法 B, 使 得 如 果 A 是 多 项 式 时 间 的 . 则 B 也 是 多 项 式 时 间 的 . 这 个 做 法 称 作 归 约 . 8.7 节 也 


9.2.2 NP 完全 性 及 其 性 质 


定义 9.5 ”如果 对 所 有 的 了 IE NP, 了 二, 了 , 则 称 工 是 NP 难 的 . 如 果 工 是 NP 难 的 且 
JIE NP, 则 称 荆 是 NP 完全 的 . 

根据 推论 9. 1,NP 难 的 问题 不 会 比 NP 中 的 任何 问题 容易 ,因此 NP 完全 问题 是 NP 中 
最 难 的 问题 . 下 述 定理 都 很 容易 证 明 ,把 它们 的 证 明 留 做 习题 . 

定理 9.4 如 果 存 在 NP 难 的 问题 ITEP. 则 P 一 NP. 

推论 9.2 假设 P 关 NP, 那 么 ,如果 匡 是 NP 难 的 , 则 了 I&P. 

虽然 “P 二 NP?” 至 今 还 没有 解决 .但 研究 人 员 普 遍 相 信 P 了 隆 NP. 因 而 NP 完全 性 成 为 表 
明 一 个 问题 很 可 能 是 难 解 的 (不 属于 P 了 ) 有 力 证 据 . 

定理 9.5 ”如果 存在 NP 难 的 问题 了 .使 得 了 三 ,了 . 则 二 是 NP 难 的 . 

推论 9.3 如 果 TENP 并 且 存 在 NP 完全 问题 了 使 得 了 三 , 工 , 则 荆 是 NP 完全 的 . 

定理 9. 5 提供 了 证 明 荆 是 NP 难 的 一 条 “捷径 ”, 不 再 需要 把 NP 中 所 有 的 问题 多 项 式 
时 间 变 换 到 匡 , 而 只 需要 把 一 个 已 知 的 NP 难 问题 多 项 式 时 间 变 换 到 工 . 根据 推论 9.3, 为 了 
证 明 二 是 NP 完全 的 ,只 需 做 下 述 两 件 事 : 

(1) 证 明 IENP. 


NP 完 会 性 


(2) 找到 一 个 已 知 的 NP 完全 问题 了 ,并 证 明 I 二 ,I. 
但 是 ,直到 现在 我 们 还 不 知道 哪个 问题 是 NP 完全 的 ,甚至 不 知道 是 否 真 的 有 NP 完全 
问题 . 9. 2. 3 节 将 对 此 给 予 肯定 的 回答 ,给 出 “第 一 个 ”NP 完全 问题 . 


9.2.3 Cook-Levin 定理 一 一 第 一 个 NP 完全 问题 


20 世纪 70 年 代 初 ,S. A. Cook 和 L. A. Levin 分 别 独立 地 证 明了 第 一 个 NP 完全 问题 ， 
这 是 命题 逻辑 中 的 一 个 基本 问题 . 


在 命题 逻辑 中 , 变 元 的 取 值 为 0 或 1, 其 中 0 表示 “ 假 ”,1 表示 “ 真 ”合式 公式 是 由 变 元 、 


逻辑 运算 符 以 及 圆 插 号 按照 一 定 的 规则 组 成 的 表达 式 . 变 元 和 它 的 否定 称 作文 字 . 有 限 个 文 
字 的 析 取 称 作 简单 析 取 式 . 有 限 个 简单 析 取 式 的 合 取 称 作 合 取 范 式 . 例如 ， 

Cam VY i ty A sy 

Cx Vw) A Cm YY iV) A i 

Cn VY mw VY wd NE YW Tm Va A ms MN ms 

Fi 是 合式 公式 ,但 不 是 合 取 范 式 ;F: 和 Fs 是 合 取 范式 ,当然 也 是 合式 公式 . 

设 下 是 关于 变 元 x1 ,zxs，… ,x， 的 合式 公式 . 给 定 每 一 个 变 元 的 真 假 值 称 作 关于 变 元 
zivzay 和 yzn 的 赋值 .如果 赋值 t:{ziyz, yz) 一 (0,1} 使 得 上 CGF) 一 1, 则 称 : 是 已 的 成 真 
赋值 . 如 果 下 存在 成 真 赋值 , 则 称 下 是 可 满足 的 . 

例如 , 令 t(z1) 二 1,t(zxs) 二 0,t(zxs) 二 1.1 是 Fl 和 F 的 成 真 赋值 ,从 而 F 和 下 是 可 满 
足 的 .1 不 是 下 的 成 真 赋值 ,事实 上 F; 不 是 可 满足 的 . 

可 满足 性 (SAT) : 任 给 一 个 合 取 范式 下 , 问 下 是 可 满足 的 吗 ? 

定理 9.6 (Cook-Levin 定理 )SAT 是 NP 完全 的 . 


i 
下 2 
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这 个 问题 属 


阅 参考 文献 [7]. 


F NP 是 显然 的 ,证 明 它 是 NP 难 的 超出 了 本 书 的 范围 有 兴趣 的 读者 可 参 


由 于 确实 存在 NP 完全 问题 ,定理 9.4 可 以 改写 成 下 述 定理 . 
定理 9.7 P= 二 NP 的 充分 必要 条 件 是 存在 NP 完全 问题 IEP. 


9.3 ” 几 个 NP 完全 问题 


本 节 从 SAT 开始 ,利用 多 项 式 时 间 变 换 证 明 几 个 NP 完全 问题 ,采用 的 多 项 式 时 间 变 
换 关系 如 图 9. 1 所 示 . 


3SAT 最 大 可 满足 
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9.3.1 最 大 可 满足 性 与 三 元 可 满足 性 


利用 SAT 的 NP 完全 性 .很 容易 证 明 下 述 问题 也 是 NP 完全 的 . 

最 大 可 满足 性 (MAX-SAT) : 任 给 关于 变 元 zx ,zs,… ,x 的 简单 析 取 式 C1 ,Cs,… ,Cnv 
及 正 整数 K , 问 存在 关于 变 元 zi ,xs，… ,xs 的 赋值 使 得 Ci,C,…,C。 中 至 少 有 天 个 为 
真 吗 ? 

设 判 定 问 题 I 二 二 D,Y 二 ,I 二 过 D',Y ,如 果 D'SD,Y'==D'NY, 则 I 是 工 的 特殊 
情况 , 称 作 荆 的 子 问题 . 

例如 ,“ 给 定 一 个 平面 图 G, 问 G 是 哈密 顿 图 吗 ?” 是 HC 的 子 问题 . 可 以 把 SAT 看 作 
MAX-SAT 的 特殊 情况 一 一 当 二 m 时 ,赋值 1 使 Ci,C;,…,C, 中 至 少 及 二 mr 个 为 真 , 即 
1 使 Ci ,Cs,…,C 全 部 为 真 ,这 当 且 仅 当 1 是 下 二 Ci 人 Cs 人 … 信 C 的 成 真 赋值 ,从 而 MAX- 
SAT 退化 成 SAT. 详细 地 说 , 设 I 是 SAT 的 一 个 实例 , 它 是 关于 变 元 zi ,zx，，… ,x 的 合 取 范 
式 下 二 C1 人 Cs 人 … 信 C ,如 下 构造 MAX-SAT 的 实例 I: 由 简单 析 取 式 Ci ,Cs ,… ,Cs 和 
正 整 数 K 二 mm 构成 . 显然 ,I 为 Yes 实例 当 且 仅 当 了 为 Yes 实例 ,从 而 可 以 把 SAT 看 作 
MAX-SAT 当 KK 二 m 时 的 特殊 情况 , 即 可 以 把 SAT 看 作 MAX-SAT 的 子 问题 . 

设 了 = 二 D',Y > 是 了 = 二 D,Y> 的 子 问题 ,容易 把 兢 多 项 式 时 间 变换 到 五, 变换 把 三 
的 每 一 个 实例 I 映射 到 自己 , 即 变换 /( 了 )==T. 从 而 如 果 已 知 耳 的 子 问题 I 了 是 NP 难 的 , 则 
荆 也 是 NP 难 的 . 其 实 , 这 是 再 显然 不 过 的 事情 一 一 任何 问题 当然 不 会 比 它 的 子 问题 容易 . 

定理 9.8 MAX-SAT 是 NP 完全 的 . 

证 显然 MAX-SATENP, 任 意 猜想 一 个 关于 变 元 mm ,zo，… ,zx 的 赋值 ,不 难 检查 Ci ， 
Cz,…,Cn 中 是 否 至 少 有 开 个 为 真 . 

由 于 SAT 可 以 看 作 MAX-SAT 的 子 问题 ,容易 把 SAT 多 项 式 时 间 变 换 到 它 .对 SAT 的 
每 一 个 实例 1,T 是 关于 变 元 zi, ze,…,zn 的 合 取 范式 下 二 C1 人 Cs 人 … 人 Ch, 其 中 Ci， 
Cs,…,C 是 简单 析 取 式 ,对 应 的 MAX-SAT 的 实例 /( 了 由 简单 析 取 式 Ci ,Cs,…,C 和 正 
整数 KK 二 =m 构成 . 显然,f 是 多 项 式 时 间 可 计算 的 . 又 ,赋值 1 是 下 的 成 真 赋值 当 且 仅 当 上 使 
CisCz，… ,Cn 都 为 真 ,从 而 工 的 答案 是 “Yes” 当 且 仅 当 / (1) 的 答案 是 “Yes”, 得 证 
SAT, MAX-SAT. 

下 面 考虑 SAT 的 一 个 子 问题 一 一 三 元 可 满足 性 . 如 果 合 取 范 式 的 每 一 个 简单 析 取 式 恰 
好 有 3 个 文字 , 则 称 这 种 合 取 范 式 为 3 元 合 取 范式 . 当 限 制 SAT 实例 中 的 合 取 范式 为 3 元 
合 取 范 式 时 , 称 作 三 元 可 满足 性 (3SAT) , 即 

三 元 可 满足 性 (3SAT) : 任 给 一 个 3 元 合 取 范式 下 , 问 下 是 可 满足 的 吗 ? 

定理 9.9 3SAT 是 NP 完全 的 . 

证 由 于 3SAT 是 SAT 的 特殊 情况 , 故 3SATE NP. 

为 了 证 明 3SAT 是 NP 难 的 ,要 证 SAT 二 ,3SAT. 注意 ,这 里 是 要 把 SAT 多 项 式 时 间 变 换 
到 3SAT, 而 不 是 把 3SAT 多 项 式 时 间 变 换 到 SAT. 由 于 3SAT 是 SAT 的 特殊 情况 ,后 者 是 很 
容易 做 到 的 ,但 不 能 解决 任何 问题 . 

任 给 一 个 合 取 范式 下 ,要 构造 对 应 的 3 元 合 取 范 式 已 二 了/(F) ,使 得 下 是 可 满足 的 当 且 
仅 当 F' 是 可 满足 的 . 具体 构造 如 下 : 

设 F 一 A,C;, 其 中 Cj; (1 二 j 吉 ) 是 简单 析 取 式 ,对 应 的 = 其 囊 天 对 应 


n 


CiCs) 委 im) ,是 3 元 合 取 范 式 , 并 且 
Ci 是 可 满足 的 当 且 仅 当 下 ?是 可 满足 的 . (x) 
这 样 的 天 显然 满足 F 是 可 满足 的 当 且 仅 当 FF' 是 可 满足 的 . 
下 面 分 情况 构造 FF ,其 中 诸 = 表示 文字 , 即 某 个 变 元 x 或 它 的 否定 一 xx。 
(1) G; 二 xz1. 引入 两 个 新 变 元 yj ,yjz , 令 
Fi=(a V yn V ye) MN (a V yn V yn) 
A (ziV yanV Tya) A CzV Tyn VV 7 yi) 
由 于 yanVys7T7 了 yanV ynyynV -7 yn， ynV -yn 不 能 同时 为 真 , 故 为 真 当 且 仅 当 
z1 二 1, 从 而 式 ( x ) 成 立 . 
(2) Cj 二 zi V zz. 引入 一 个 新 变 元 yj , 令 
Fi= (aVz Vy) NzV za V Ty) 
(3) Ci 一 zi Vz Vzs. 令 FI=C,. 
对 于 这 两 种 情况 式 ( * ) 显 然 成 立 . 
(4) CG; 二 x V zz V…V zhs 宇 4. 引入 一 3 个 新 变 元 和 mn ,yj ya ，, 令 
Fi=(zV x V yan) MN Coyn Vz V ya) NM CTy VV ys) 
人 …A 人 (ny Vee V yan) A Tyas V ze V zi) 
设 赋值 1 满足 Cj, 则 存在 i (1 二 ik) 使 得 zz;)==1, 把 1 扩张 到 {yy ya-w) 上 . 
当 i 二 1 或 2 时 , 令 t(yj)=0 (1 二 sk 一 3); 当 i==k 一 1 或 & 时 , 令 1(yj)=1 (1 二 ;<k 一 3); 
当 3 委 ; 委 4 一 2 时, 令 


1 一 
ty ) 一 
必 一 

不 难 验 证 元 轧 )=1, 反 之 , 设 2(F))=1, 若 in)=05 则 zz V 纠 )=13 车 zyw=s)=1, 则 
te-iV ai) 一 1; 和 否则 必 有 (1 委 s 委 4 一 4) ,使 得 tC(yj)==1 且 tCyjorv ) 一 0, 从 而 zx+s) 一 1 
总 之 ,都 有 :CCi) 一 1. 得 证 式 (* ) 成 立 . 

最 后 ,FF; 中 简单 析 取 式 的 个 数 不 超 过 C; 中 文字 个 数 的 4 倍 , 每 个 简单 析 取 式 有 3 个 
文字 ,因此 可 以 在 |F| 的 多 项 式 时 间 内 构造 出 F'. 得 证 / 是 SAT 到 3SAT 的 多 项 式 时 间 

3SAT 由 于 其 简单 整齐 的 结构 在 NP 完全 性 证 明 中 经 常 被 用 做 已 知 的 NP 完全 问题 . 


9.3.2 顶点 履 盖 \、 团 与 独立 集 


设 无 向 图 G 王 <V,E>> ,VSV. 如 果 G 的 每 一 条 边 都 至 少 有 一 个 顶点 在 冯 中 , 则 称 
V "是 G 的 一 个 顶点 覆盖 . 如 果 对 任意 的 woE V' 且 w 关 v. 都 有 (u,v)EE, 即 V' 导 出 的 子 图 
是 完全 子 图 , 则 称 V' 是 G 的 一 个 团 . 如 果 对 任意 的 x,uE V' ,都 有 (u,v) EE, 则 称 V' 是 G 的 
一 个 独立 集 . 下 述 图 论 中 的 引 理 表明 这 3 个 概念 是 密切 相关 的 . 

引 理 9.1 对 任意 的 无 向 图 G 二 二 V ,E 放 > 和子 集 V SV .下 述 命题 是 等 价 的 : 

(1) V 是 G 的 顶点 覆盖 . 

(2) V 一 V' 是 G 的 独立 集 . 

(3) V 一 V 是 补 图 G 二 过 V .E> 的 团 ,其 中 E={(u,w)|lu,v€ Vu¥v 且 (u,v) FE}. 

考虑 下 述 3 个 问题 : 


击 必 器 


算法 谈 计 与 分 帮 ( 血 2 版 ) 


顶点 覆盖 (VC) : 任 给 一 个 无 向 图 G 二 二 V,E 这 和 非 负 整数 K 三 I|V|, 问 G 有 顶点 数 不 
超过 天 的 顶点 覆盖 吗 ? 

团 : 任 给 一 个 无 向 图 G 二 二 V,E 二 和 非 负 整数 J 三 1V1, 问 G 有 项 点 数 不 小 于 本 的 
团 吗 ? 

独立 集 : 任 给 一 个 无 向 图 G 二 二 V.E 和 非 负 整 数 J 三 I|V|, 问 G 有 顶点 数 不 小 于 J 的 
独立 集 吗 ? 

这 3 个 问题 都 属于 NP. 根据 引 理 9. 1 ,很 容易 把 这 3 个 问题 中 的 一 个 问题 多 项 式 时 间 
变换 到 另 一 个 问题 . 例如 ,把 顶点 覆盖 多 项 式 时 间 变 换 到 独立 集 : 任 给 顶点 覆盖 的 一 个 实 
例 , 它 由 无 向 图 G 二 二 V ,E> 和 非 负 整数 KK 过 |V| 组 成 ,对 应 的 独立 集 的 实例 由 无 向 图 G= 
二 V ,E> 和 非 负 整数 J 二 1|V| 一 K 组 成 . 另外 两 个 变换 留 做 习题 . 因此 ,只 要 证 明 这 3 个 问题 
中 的 一 个 是 NP 完全 的 ,就 得 到 另外 两 个 也 是 NP 完全 的 . 

定理 9.10 顶点 覆盖 是 NP 完全 的 . 

证 不 难 构 造 VC 的 非 确 定型 多 项 式 时 间 算 法 : 对 任 给 的 无 向 图 G 王 二 V, 下 之 和 非 负 
整数 K 志 |V| ,任意 猜想 一 个 子 集 V'SV,|V'|<K ,检查 V 是 否 是 一 个 顶点 覆盖 , 即 G 的 每 
一 条 边 是 否 至 少 有 一 个 端点 在 V 中 .从 而 ,VCE NP. 

下 面 要 证 3SAT<,VC. 任 给 3SAT 的 一 个 实例 T,T 由 关于 变 元 x1 ,zs，… ,x 的 3 元 合 
取 范 式 P= he 构成 ,其 中 Cj; 二 zn V zjs V zjsa za 是 某 个 zi 或 上 zi 一 1,2,3,1 委 ) 委 mm 
要 构造 VC 的 实例 /( 了 ), 它 由 一 个 无 向 图 G= 二 二 V,E 这 和 非 负 整数 构成 ,使 得 下 是 可 满 
足 的 当 且 仅 当 G 有 顶点 数 不 超 过 的 顶点 覆盖 . 也 就 是 说 要 设法 用 G 和 K 来 描述 下 . 

为 了 表示 变 元 x; 及 对 它 的 赋值 ,构造 两 个 顶点 x; 和 z; 及 连接 它们 的 边 (z;,zi). 为 了 
覆盖 (ziE;) ,任何 顶点 覆盖 在 x; 和 FE; 中 必须 取 一 个 (后 面 还 要 利用 K 保证 只 能 取 一 个 ). 
取 zi 对 应 令 zi; 为 1, 取 元 ;对 应 令 zi 为 0. 这 是 G 的 第 一 部 分 : 


Vi= {zor |l1<i<n), El={(r7)|1l1<i<n)} 
G 的 一 个 顶点 覆盖 在 Wi 中 取 的 顶点 对 应 对 变 元 zi ,zs，… ,zs 的 一 个 赋值 7. 
G 的 第 二 部 分 表示 下 的 m 个 简单 析 取 式 . 对 每 一 个 简单 析 取 式 Cj; 二 zn Vz js， 构造 
一 个 三 角形 ,3 个 顶点 是 [zf , 门 、[xz ;站 和 [zs ,站 ,其 中 当 zz 二 x 时 ,zh 二 Ti; 当 二 了 ; 
时 ,zh 二 zi,k 二 1,2,3. 显然 ,任何 顶点 覆盖 必须 在 这 3 个 顶点 中 取 两 个 . 


V, = {[z% 7] Ik=1,2,3,1] <j<m} 
下 = {Len 0] Lj]), (Lz 57] Lj]) ,Leis Lean]) | 1<jEm) 
由 于 任何 项 点 覆盖 V' 在 x; 和 zz; 中 至 少 取 一 个 ,在 [zh , 门 、[zis ,和 [zis ,jj 中 至 少 取 
2 个 , 故 V' 至 少 有 nn 十 2m 个 顶点 . 令 KK 二 n 十 2m, 于 是 任何 顶点 数 不 超 过 的 顶点 覆盖 
VV 恰好 包含 开 个 顶点 ,并 且 一 定 是 每 一 对 x; 和 Zz; 中 取 一 个 ,每 个 三 角形 的 3 个 顶点 [x , 门 、 
[zj ,J 和 [zs ,7 中 取 两 个 . 
最 后 ,为 了 保证 下 是 可 满足 的 当 且 仅 当 G 有 顶点 数 不 超 过 的 顶点 覆盖 了 ,在 Vi 和 
Vs 的 顶点 之 间 添 加 一 些 边 ,这 是 G 的 第 三 部 分 
FE; 一 {([z% 2 ) I1k=1,2,3,1 jm} 
对 每 一 个 j(1 志 j 三 mm) ,由 于 V 包含 对 应 C; 的 三 角形 的 3 个 顶点 中 的 两 个 ,覆盖 了 从 这 两 个 
顶点 新 引出 的 边 , 还 剩 下 一 条 新 引出 的 边 ([z% , 门 ,zn ) 必 须 由 另 一 个 端点 x% 覆盖 ,这 就 要 求 


V 包含 xxx. 而 这 又 恰好 对 应 赋值 上 使 得 :(=x) 一 1, 从 而 满足 简单 析 取 式 C;. 
VC 的 实例 FTD 由 无 向 图 G 王 <V,E> 和 开 一 2 十 2 构成 ,其 中 V==ViUVs,E=EU 
FE; UE;. 图 9.2 给 出 一 个 例子 . 


po EBD Ea Ed 
图 9.2 对 应 F=(CzVvnmzeVvxzr)ACzVxzs yz) 的 图 G 


设 1 是 下 的 成 真 赋值 ,对 每 一 个 i(1 志 i 二 nn) ,车 +(zi) 二 1, 则 取 顶 点 xi; 车 1(z;) 二 0, 则 
取 顶 点 zi. 这 nn 个 顶点 覆盖 E. 对 每 一 个 j(1 二 jm), 由 于 1(C;) 二 1,C; 至 少 有 一 个 文字 
zx 的 值 为 1. 于 是 ,从 对 应 的 三 角形 的 顶点 [zi , 门 引 出 的 边 ([Lxx ,站 ,x%) 已 被 覆盖 . 取 该 三 
角形 的 另外 两 个 顶点 ,这 就 覆盖 了 这 个 三 角形 的 3 条 边 和 引出 的 另外 两 条 边 . 这 样 取 到 的 
7 十 27 个 顶点 是 G 的 一 个 顶点 覆盖 . 

反之 , 设 V'SV 是 G 的 一 个 顶点 覆盖 且 |V | 三 K=n 十 2m. 根据 前 面 的 分 析 , 每 一 对 xz; 
和 去 ; 中 恰好 有 一 个 属于 V ,每 一 个 三 角形 恰好 有 两 个 顶点 属于 V'. 对 每 一 个 i(1<i<n)， 
若 x;EV', 则 令 t(zi)= 二 1; 若 ;EV , 则 令 txi)==0. 对 每 一 个 j(1 志 j 志 mm), 设 [zh,j] V'， 
为 了 覆盖 边 ([x, 门 , 吹 ), 必 有 次 EV 由 于 上 xx) 一 1, 从 而 5C) 王 1. 因 此 ,是 下 的 成 真 
赋值 ,得 证 下 是 可 满足 的 . 

G 有 2n 十 3m 个 顶点 和 nn 十 6m 条 边 , 显 然 能 在 多 项 式 时 间 内 构造 G 和 天 .因此 这 是 
3SAT 到 VC 的 多 项 式 时 间 变 换 . 得 证 3SAT<, VC. 

上 述 证 明 方 法 称 作 构 件 设计 法 ,证 明 中 设计 了 两 种 “构件 ”一 一 变 元 构件 和 简单 析 取 式 
构件 , 变 元 构件 是 一 对 顶点 x;、z; 及 连接 它们 的 边 ,简单 析 取 式 构 件 是 三 角形 . 用 这 些 构件 
及 构件 之 间 的 连接 构成 G, 每 个 构件 各 有 其 功能 ,通过 这 种 方式 到 达 用 VC 的 实例 表达 
3SAT 的 实例 的 目的 . 

根据 引 理 9. 1 给 出 的 项 点 覆盖 、 独 立 集 和 团 之 间 的 关系 ,由 定理 9. 10 容易 证 明 下 述 
定理 . 

定理 9.11 独立 集 和 团 是 NP 完全 的 . 


9.3.3 哈密 顿 回路 与 货 郎 问题 


本 节 证 明 哈 密 顿 回路 和 它 的 有 向 形式 一 一 有 向 哈密 顿 回路 (有 向 HC) 一 一 以 及 货 郎 问 
题 的 NP 完全 性 . 把 哈密 顿 回路 中 的 图 改 成 有 向 图 既是 有 向 哈密 顿 回 路 . 

定理 9.12 有 向 HC 是 NP 完全 的 . 

证 ”类似 HC 可 证 有 向 HCE NP, 下 面 要 证 3SAT 委 有 向 HC. 任 给 变 元 zi ,za ，…，zv 
的 3 元 合 取 范式 FE 从 本 于 中 C= 二 zn V zjz V zjs， 每 个 zx 是 某 个 zi; 或 "ri,k=1,2,3， 
1 二 j 二 mm. 要 构造 一 个 有 向 图 D 王 二 V,E> ,使 得 下 是 可 满足 的 当 且 仅 当 D 有 哈密 顿 回 路 . 

采用 构件 设计 法 构造 D. 表示 变 元 zx; 的 构件 是 一 条 由 一 串 水 平 的 顶点 组 成 的 链 工 ;,, 相 
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邻 的 两 个 顶点 之 间 有 一 对 方向 相反 的 有 向 边 . 只 有 两 种 可 能 的 方式 通过 L; 上 的 所 有 项 
点 一 一 从 左 到 右 或 从 右 到 左 通过 L: 上 的 所 有 顶点 ,这 恰好 对 应 zx; 的 值 为 1 或 为 0. 表示 简 
单 析 取 式 C; 的 构件 是 一 个 顶点 cj. 除去 cj 与 L; 之 间 的 连接 ,整个 D 如 图 9. 3 所 示 . 任何 哈 
密 顿 回路 可 以 从 % 开始 ,对 每 一 个 i(1 志 i 志 n 一 1) ,回路 必须 从 左 到 右 或 从 右 到 左 地 通过 链 
Li ,然后 经 过 连接 两 条 链 的 中 间 顶 点 s; 到 下 一 条 链 L;+1 ,最 后 经 过 L, 到 s,, 回 到 so 结束 . 


oc, 


图 9.3 有 向 图 DD 中 的 两 种 构件 


关键 是 在 两 种 构件 之 间 添 加 一 些 边 使 得 下 是 可 满足 的 当 且 仅 当 D 有 哈密 顿 回路 . 链 
L; 有 3m 十 1 个 顶点 ,依次 为 dw,ansbasdasazsbssdz，s… ,aims bm;s din. 对 每 一 个 Cj 一 
zn VV zjz V zja， 如 果 zi 二 zx;, 则 添加 两 条 有 向 边 二 aj ,cj 二 和 二 cj ,她 二; 如果 zn 二 一 zi, 则 添 
加 过 cj ,a5 二 和 过 biy ,cj,k 二 1,2,3. 图 9.4 给 出 一 个 例子 . 这 就 完成 了 整个 DD 的 构造 . 显 


然 , 构 造 D 可 以 在 多 项 式 时 间 内 完成 . 下 面 要 证 下 是 可 满足 的 当 且 仅 当 D 有 哈密 顿 回 路 , 


[2 


十 
® dio ap dsl Ay bas di 


图 9.4 C= 二 zi1V 了 了 x3V 一 x 对 应 的 结构 


设 下 是 可 满足 的 ,t 是 下 的 成 真 赋值 . 要 根据 : 构造 一 条 从 so 到 s, ,最 后 回 到 so 的 哈密 
顿 回路 . 先 暂 时 不 考虑 所 有 的 oj. 车 Cz) 二 1, 则 从 so 到 ce: 从 左 到 右 经 过 Li 的 所 有 顶点 
到 达 di ,再 到 5; 车 tz) 二 0, 则 从 so 到 ,从 右 到 左 经 过 Li 的 所 有 顶点 到 达 dio ,再 到 
5s1. 一 般 地 ,依次 对 i 二 1,2,…,n 进行 ,车 1(zi) 二 1, 则 从 si;-1 到 di ,从 左 到 右 经 过 Li 的 所 有 
顶点 到 达 4d ,再 到 si; 车 1xi) 二 0, 则 从 s;_1 到 4d: 从 布 到 左 经 过 L; 的 所 有 顶点 到 达 di ,再 
到 5;. 最 后 ,从 s, 回 到 yo. 现在 要 将 cj (1 三 j 二 mmr) 插入 这 条 回路 中 . 设 C; 二 zn Vi V xs ,由 于 


NP 完 会 性 


t(C;) 二 1, 必 有 k(1 二 k 二 3) 使 得 (zj ) 二 1. 车 六 一 与 , 则 通路 从 左 到 右 经 过 工 , 且 有 有 向 边 
一 rc 二 和 去 ci ,0 二 .于 是 ,可 以 把 cj 揪 在 oz 与 好 之 间 ; 若 zx 一 xi;, 则 通路 从 右 到 左 经 
过 L;, 且 有 有 向 边 二 bj; ,cj 这 和 二 cj ;ai 之 .于 是 ,可 以 把 6c 插 在 6b; 与 45 之 间 . 这 就 得 到 D 中 
的 一 条 哈密 顿 回 路 . 

反之 , 设 D 有 一 条 哈密 顿 回路 已. 显然 ,P 必须 从 ,到 ,因为 二 ws 二 是 这 两 个 顶点 
之 间 唯 一 的 一 条 边 . 不 妨 设 已 从 se 开始 到 s, ,最 后 回 到 so 结束 .我 们 称 上 面 构造 的 那 种 哈 
密 顿 回路 是 正常 的 , 即 正常 的 回路 从 左 到 右 或 从 右 到 左 通过 每 一 条 L; ,每 一 个 cj 插 在 某 个 
o1 和 好 或 好 和 之 间 . 如果 己 是 正常 的 ,容易 根据 已 规 定 正 的 一 个 成 真 赋值 1: 若 己 从 左 
到 右 通 过 工 ;, 则 令 :zi) 一 1; 若 已 从 右 到 左 通过 二 , 则 令 t(zi) 二 0. 根据 cj 插入 工 ; 的 方式 ， 
不 难 证 明 5(C) ) 一 1. 

剩 下 的 问题 是 要 证 明 P 一 定 是 正常 的 . 假设 不 然 ,破坏 正常 性 的 唯一 可 能 是 已 从 某 条 
链 上 ,上 的 顶点 u 到 cj 后 没有 回 到 同一 条 链 中 的 顶点 ,而 是 到 另 一 条 链 L,(s 隆 ) 中 的 顶点 . 
若 x 一 ay ,由 于 好 只 与 ay、cj 及 dy 相 邻 ,P 已 经 过 ay 和 cj ,br 只 剩 下 一 个 相 邻 的 顶点 , 故 
也 不 可 能 通过 0 . 若 v= 久 ,由 于 ay 只 与 by ci 及 dwj-v 相 邻 ,P 已 经 过 bsy 和 cj,asy 也 只 和 镜 下 
一 个 相 邻 的 顶点 , 故 已 不 可 能 通过 av. 都 与 已 是 哈密 顿 回路 矛盾 ,所 以 P 一定 是 正常 的 . 

定理 9.13 HC 是 NP 完全 的 . 

证 已 知 HCE NP. 要 证 有 向 HC<，HC. 任 给 一 个 有 向 图 D==<<V,E 之 ,要 构造 一 个 无 
向 图 G 二 二 V',E' 二 使 得 D 有 哈密 顿 回 路 当 且 仅 当 G 有 哈密 顿 回路 . 这 里 的 关键 是 如 何 用 
无 向 边 表示 有 向 边 . 为 此 ,我 们 把 D 的 每 一 个 顶点 替换 成 3 个 顶点 v*,v™™ 和 ww ,用 边 连 
接 志和 wmv 中 和 wD 中 的 每 一 条 有 向 边 二 u,v 二 在 G 中 替换 成 (u,v"). 即 

VV = 0 
E’ = {u,v") |<uv EE}U (Co oma) (vv) |vEV} 
不 难 证 明 这 个 G 满足 上 面 的 要 求 且 可 以 在 多 项 式 时 间 内 完成 构造 . 

上 述 证 明 中 采用 的 是 局 部 替换 法 . 当 两 个 问题 的 结构 相似 时 .往往 可 以 通过 这 种 方法 构 
造 多 项 式 时 间 变 换 . 实际 上 ,在 定理 9. 9 中 证 明 SAT 反 ,3SAT 也 是 采用 局 部 替换 法 . 在 那里 ， 
是 把 SAT 实例 中 的 每 一 个 简单 析 取 式 蔡 换 成 若干 个 3 元 简单 析 取 式 的 合 取 . 

已 经 知道 TSPE NP, 又 在 例 9. 1 中 证 明了 HC 反 ,TSP, 因 此 有 

定理 9.14 TSP 是 NP 完全 的 . 


9.3.4 恰好 覆盖 


恰好 覆盖 : 给 定 有 穷 集 A 二 {a ,as,… ,a,} 和 A 的 子 集 的 集合 W={S1,S:,…,S,), 问 : 
存在 子 集 USW 使 得 U 中 的 子 集 都 是 不 相交 的 且 它 们 的 并 集 等 于 A? 称 W 这 样 的 子 集 
U 是 A 的 恰好 覆盖 . 

例如 , 设 A={1,2,3,4,5},Si= 二 {1,2} ,Ss 二 {1,3,4),Ss 二 {2,4),S,= 二 {2,5), 则 {S,,S,} 
是 A 的 恰好 覆盖 . 若 把 S, 改 为 S, 二 13,5}, 则 不 存在 A 的 恰好 覆盖 . 

定理 9.15 恰好 覆盖 是 NP 完全 的 . 

证 显然 恰好 覆盖 E NP. 问题 的 非 确定 型 多 项 式 时 间 算 法 如 下 : 给 定 有 穷 集 A 和 A 的 
子 集 的 集合 W ,任意 猜想 W 的 一 个 子 集 UU, 验 证 U 是 否 是 A 的 恰好 覆盖 . 显然 这 可 以 在 多 
项 式 时 间 内 完成 ,并 且 能 猜 到 一 个 恰好 覆盖 U 当 且 仅 当 W 中 存在 A 的 恰好 覆盖 . 
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下 面 证 明 可 满足 性 二 恰好 覆盖 . 任 给 变 元 zi ,zs，… ,zx 的 合 取 范式 FF 二 Ci A Cs 人 人 … 
Cm, 其 中 Gj 二 zn V zjz V…V zj 1'j 二 1,2,…,m, 要 构造 有 穷 集 A 和 A 的 子 集 的 集合 W 使 
得 ,下 是 可 满足 的 当 且 仅 当 W 含有 A 的 恰好 覆盖 . 再 次 采用 构件 设计 法 , 取 

A= {zisr29°% 3 Tas CisC2 ssCn} U {pr | lt sl<Ii<m)} 
其 中 pp 代表 C; 中 的 文字 z;. 

对 每 一 个 变 元 x; 有 两 个 子 集 TY 和 Tf,7T? 包含 x; 及 了 zi 在 所 有 简单 析 取 式 中 的 出 

现 ,TF 包含 x; 及 zx; 在 所 有 简单 析 取 式 中 的 出 现 : 

三 Yoh | = 

T= {zipr | zx = Xol Ets5,l jim} 
其 他 的 子 集中 都 不 含 x; ,因此 任何 恰好 覆盖 U 必须 恰好 包含 TY 和 TF 中 的 一 个 ,这 对 应 对 
Zi 的 赋值 : i(zi;) 二 1 当 且 仅 当 UU 包含 TH. 注意 ,i(zxi) 的 值 与 U 包含 的 Ti 或 TF 中 的 pi 所 
代表 的 x; 正好 相反 . 

对 每 一 个 C; ,有 sj 个 子 集 ; Ci 二 {CG ,pan) ,1 二 t<s,. 除 此 之 外 ,每 一 个 pi 构成 一 个 单元 
子 集 {pj}). 

综合 起 来 ,W 包含 下 述 子 集 : 

{px}, 1 <t<s,1<j<m, 
TT = {zisps | zs = Tx lt ss 1 
T= {zopy | = lt<s,1< 
Cx = {Copix}, lt<s, 1<j<m 
例如 , 设 F=CACAGAC ,其 中 G=zV 了 xsG = 了 TVrVrG=nV 7 rtV zr, 
CG,=zxziV -x3, 则 
A = {zi,T2 ,T3901 Cs ,C3 C4 pu pz pas pos + pzss Pas paz spss bus pas} 
W 包含 下 述 子 集 : 
{pn}, {pie}, (pa) {pes} {pas} {pa} {pa}, (pas} {pa} (pr), 
TT = {zipa}, TF = {zpnspaspu}, 
T= {ripn}; B= (wp 
T= Vi T= 
Cu= {Cpn}, Ci = {Cispis}, Ca = {Czspa}, C2 = {C2, pz), 
Ca = {Cs ,paa}, Ca {C3,pa}, Ca = (Ca pa) ， 
Ca = {C3,ps}, Cu {Gpa}, Cz 一 【Ce ,pn}. 

要 证 下 是 可 满足 的 当 且 仅 当 W 含有 A 的 恰好 覆盖 . 设 USW 是 A 的 恰好 和 覆盖 ,对 每 一 
个 i(1 志 in) ,车 TfEU, 则 令 i(zi)= 二 1; 若 TfEDU, 则 令 i(x;)= 二 0. 对 每 一 个 j(1j 志 mm)， 
必 有 一 个 Ci 二 {Cj ,px}EU. zi 二 Xi 或 了 "zi. 若 TIEU, 则 pn fT?, 从 而 zz 二 zxi. 此 时 有 
t(zi) 二 1, 故 t 满 足 Cj. 若 TfEU, 则 pn 儿 Tf, 从 而 zi 二 一 zi. 此 时 有 tCzxi)=0, 故 t 也 满足 
Ci 得 证 上 是 下 的 成 真 赋值 . 

反之 , 设 下 是 可 满足 的 ,i 是 下 的 成 真 赋值 . 对 每 一 个 i(1 志 i 志 ) .车 1(xi) 二 1, 则 U 包 
含 TH; 若 tzxi) 二 0, 则 U 包含 TF. 对 每 一 个 j(1 专 jm), 由 于 1 满足 C;,C; 必 有 一 个 文字 
zx 使 得 i(zi) 二 1, 从 而 U 中 现 有 的 子 集 不 包含 pi. 于 是 ,可 以 把 Ci 加 入 U. 至 此 ,U 覆盖 了 
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所 有 的 xz; 和 C;, 以 及 部 分 pi. 最 后 ,把 那些 尚未 被 覆盖 的 pj; 构成 的 单元 子 集 {pi} 加 入 U， 
即 可 得 到 A 的 恰好 覆盖 . 

由 于 下 中 的 文字 数 不 超 过 mn, 故 |A| 三 n 十 m 十 mn,W 中 的 子 集 数 不 超过 2n 十 2mn, 每 
个 子 集 的 大 小 不 超过 x 十 1, 而 且 构 造 很 简单 ,显然 可 以 在 多 项 式 时 间 内 完成 ,从 而 得 证 可 满 
足 性 三 , 恰好 覆盖 . 


9.3.5 子 集 和 、 背 包 、 装 箱 与 双 机 调度 


本 节 考 虑 子 集 和 、0-1 背包 、 装 箱 和 双 机 调度 4 个 问题 . 0-1 背包 的 定义 前 面 已 经 给 出 ， 
下 面 给 出 子 集 和 、 装 箱 与 双 机 调度 的 定义 . 

子 集 和 : 给 定 正 整数 的 集合 X={zi,zs,…,zy} 及 正 整 数 N, 问 存在 X 的 子 集 工 ,使 得 
工 中 的 元 素 之 和 等 于 N 吗 ? 即 存在 TEX 使 得 >)z; = 二 N 吗 ? 


ziET 


装 箱 : 给 定 ) 件 物品 ,物品 7 的 重量 为 正 整数 zw ,1 所) 过 2 以 及 箱子 数 KK. 规定 每 只 箱 
子 装 入 物品 的 总 重量 不 超过 正 整数 B, 问 : 能 用 只 箱子 装 入 所 有 的 物品 吗 ? 

双 机 调度 : 有 两 台 机 器 入 项 作业 .J 帮 ,J,,…,.J，,. 这 两 台 机 器 完全 相同 ,每 一 项 作业 可 
以 在 任 一 台 机 器 上 进行 ,没有 先后 顺序 ,作业 J; 的 处 理 时 间 为 4;,1 志 i<n, 截 止 时 间 为 D, 所 
有 t; 和 D 都 是 正 整数 . 问 : 能 把 项 作业 分 配给 这 两 台 机 器 在 截止 时 间 D 内 完成 所 有 的 作 
业 吗 ? 

子 集 和 是 0-1 背包 的 子 问 题 一 一 当 限 制 0-1 背包 的 实例 中 所 有 ww; 二 vw; 且 B= 二 K 时 , 退 
化 成 子 集 和 . 于 是 ,只 要 能 证 明子 集 和 是 NP 难 的 ,就 可 以 立即 得 到 0-1 背包 也 是 NP 难 的 . 
下 面 还 可 以 看 到 也 不 难 把 子 集 和 多 项 式 时 间 变 换 到 双 机 调度 ,而 双 机 调度 又 可 以 看 作 装 箱 
的 子 问 题 一 一 当 箱 子 数 K 二 2 时 的 特殊 情况 ,这 里 把 物品 看 作 作业 ,物品 的 重量 就 是 作业 的 
处 理 时 间 , 而 截止 时 间 是 每 只 箱子 允许 的 最 大 重量 B. 因此 ,我 们 从 子 集 和 的 NP 完全 性 
开始 . 

定理 9.16 子 集 和 是 NP 完全 的 . 

证 ”前面 已 经 知道 0-1 背包 ENP., 而 子 集 和 是 0-1 背包 的 子 问题 ,自然 有 子 集 和 € NP. 
下 面 要 证 恰好 覆盖 三 。 子 集 和 . 给 定 有 穷 集 A 二 {a1,as,…,a,} 和 A 的 子 集 的 集合 W= 
{Si,S;,…,S,) ,对 应 的 子 集 和 实例 包括 正 整 数 的 集合 X 一 {zi ,zo，… ,zm) 及 正 整数 NN, 每 个 zx) 
和 N 都 可 表示 成 kn 位 的 二 进 制 数 ,这 kn 位 分 成 nn 段 ,每 段 & 位 ,其 中 k=[logs (m1)1 
NN 的 每 一 段 的 第 一 位 (最 右 的 一 位 ) 为 1, 其 余 的 为 0. zx; 对 应 于 子 集 Sj. 当 ai€5; 时 ,从 左 
到 右 z; 的 第 i 段 的 第 一 位 为 1, 其余 的 为 0. 例如 ， 


A={aivazssassa}, N=0101 0101, 
Si = {a'as}, Zz1 = 01 01 00 00， 
Ss = {aisassas}s Zzxz = 01 00 01 01， 
Sa = {as}， zs = 00 01 00 00 


要 证 W 中 有 A 的 恰好 覆盖 当 且 仅 当 存在 子 集 TSX 使 得 T 中 元 素 之 和 等 于 NN. 先 来 
看 上 面 的 例子 .1S;,S;) 是 A 的 恰好 覆盖 .对 应 的 zs 十 zs 王 NN. 一 般 地 , 设 USW 是 A 的 恰 
好 覆盖 , 令 T= 二 {xj|S; EU). 由 于 A 中 的 每 一 个 元 素 在 U 的 所 有 Si 中 恰好 出 现 一 次 , 故 对 
于 二 进 制 数 的 每 一 段 ,在 工 的 所 有 xz; 中 恰好 有 一 个 的 这 一 段 为 00…01, 从 而 工 中 所 有 元 素 
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之 和 等 于 N. 反 过 来 , 设 X 的 子 集 工 中 元 素 之 和 等 于 N , 令 U 一 {S| 立 ET)}. 由 于 了 中 至 多 
有 m 个 数 , 每 一 段 有 上 ==[logs (十 1) 位 ,最 大 值 为 2 一 1 宇 m, 故 工 中 的 数 相 加 时 不 会 出 现 
段 之 间 的 进位 . 从 而 ,对 于 每 一 段 ,在 工 的 所 有 zi 中 恰好 有 一 个 的 这 一 段 为 00…01, 这 意味 
着 每 一 个 ai 在 U 的 所 有 S; 中 恰好 出 现 一 次 , 即 U 是 A 的 恰好 覆盖 . 

又 ,构造 久 和 NN 显然 可 以 在 多 项 式 时 间 内 完成 ,得 证 恰好 覆盖 过, 子 集 和 . 

定理 9.17 0-1 背包 是 NP 完全 的 . 

关于 0-1 背包 需要 做 一 点 解释 .在 3. 3 节 给 出 了 0-1 背包 问题 优化 形式 的 动态 规划 算 
法 ,其 时 间 复 杂 度 为 O(zB) ,其 中 是 物品 的 个 数 ,B 是 重量 限制 . 可 能 会 有 人 提出 这 样 的 问 
题 : 这 个 动态 规划 算法 是 多 项 式 时 间 的 ,0-1 背包 是 NP 完全 的 ,这 不 是 与 普遍 认为 NP 难 
的 问题 不 存在 多 项 式 时 间 算 法 矛盾 吗 ? 或 者 说 ,这 不 是 证 明了 P= 二 NP 吗 ? 如 果真 是 这 样 ， 
岂 不 万 事 大 吉 了 吗 ! 事实 上 ,这 个 动态 规划 算法 不 是 多 项 式 时 间 的 ,而 是 指数 时 间 的 . 这 是 
因为 在 考虑 时 间 复 杂 度 时 ,整数 的 输入 长 度 应 该 是 二 进 制 表示 的 长 度 ,而 不 是 整数 本 身 的 大 
小 (或 一 进 制 表示 的 长 度 ) ,从 而 0-1 背包 问题 的 输入 规模 不 能 用 与 B 表示 ,而 应 该 用 nn 
与 logsB 表示 (这 里 不 妨 设 所 有 的 w; 三 B),nB 不 是 与 logsB 的 多 项 式 ,因此 这 个 动态 规 
划算 法 不 是 多 项 式 时 间 算 法 . 不 过 , 当 问 题 实例 中 所 有 的 背包 重量 ww; 以 及 重量 限制 B 都 不 
超过 一 个 固定 的 常数 M 时 ,这 个 动态 规划 算法 成 为 多 项 式 时间 的 . 为 了 区 别 出 这 类 指数 时 
间 算 法 ,给 出 下 述 概 念 . 

设 实例 I 中 数 的 最 大 绝对 值 为 max(T) ,如 果 算 法 的 时 间 复 杂 度 以 11| 和 max( 了 ) 的 某 个 
二 元 多 项 式 p(T| ,max(D) 为 上 界 , 则 称 这 个 算法 是 伪 多 项 式 时 间 算 法 . 当 实例 中 的 数 不 
大 时 , 伪 多 项 式 时 间 算 法 是 有 效 的 . 3. 3 节 给 出 的 0-1 背包 问题 的 动态 规划 算法 是 伪 多 项 式 
时 间 算 法 . 

定理 9.18 双 机 调度 是 NP 完全 的 . 

证 “显然 双 机 调度 E NP, 要 证 子 集 和 三 , 双 机 调度 . 任 给 一 个 子 集 和 实例 , 它 由 正 整 
数 的 集合 X = {zi ,zz,…… ,za) 及 正 整 数 N 组 成 ,对 应 的 双 机 调度 实例 及 十 2 项 作业 六， 
J2，…… Jtz ,它们 的 处 理 时 间 分 别 为 zi ,zx2，… ,Zab, 截 止 时 间 为 D. 要 求 存在 的 子 集 T 


使 得 iw; 一 NN 当 且 仪 当 N 二 a = 汪 z 一 办 站 b== 力 ;手相 
ziET i=1 
本 二 Ss 一 2 六 十 0 
i=1 
为 了 保证 不 会 把 作业 J ,Jatz 与 其 他 作业 混淆 ,只 需 把 a,b 取得 足够 大 . 取 
b= Sis 十 2N，a 一 2 D= di | 
i=1 i=1 i=1 


假设 X 的 子 集 工 使 得 >)z; = N, 把 {J; | x; € T) U {Jn) 分 配给 第 1 台 机 器 ,其 余 的 


ET 
作业 分 配给 第 2 台 机 器 ,这 两 台 机 器 的 工作 时 间 都 是 N+a = 了 lx 一 N46 二 了 D. 
i=1 
反之 ,假设 这 十 2 项 作业 可 以 分 配 到 两 台 机 器 上 .使 得 每 台 机 器 的 工作 时 间 都 不 超过 


DD. 注意 到 十 2 项 作业 的 总 处 理 时 间 为 >) zx, 十 a 十 b 一 4 > zi 十 2N 一 2D, 故 这 两 台 机 器 


的 工作 时 间 都 恰好 为 D. 又 注意 到 a 十 4b 一 3 十 2N 二 D. 故 J, 和 Jss 不 能 分 配给 同 


一 台 机 器 .不 妨 设 J 被 分 配给 第 1 台 ;机 器 ,把 除 J 外 分 配给 第 1 台 机 器 的 所 有 作业 构成 
的 集合 记 作 J. 令 工 = (1JEJ), 则 有 >)zi=D 一 “一 N. 


seET 
根据 子 集 和 的 实例 构造 双 机 调度 的 实例 是 很 简单 的 , 且 每 项 作业 的 处 理 时 间 及 截止 时 
间 都 不 非常 大 ,显然 可 以 在 多 项 式 时 间 内 完成 . 得 证 子 集 和 三 , 双 机 调度 . 
定理 9. 19 装 箱 是 NP 完全 的 . 


9.3.6 整数 线性 规划 


在 第 6 章 已 经 介绍 过 线性 规划 有 多 项 式 时 间 算 法 , 但 整数 线性 规划 要 难得 多 . 与 前 面 
的 问题 不 同 , 很 容易 证 明 整 数 线性 规划 是 NP 难 的 , 而 证 明 它 属于 NP 却 并 不 容易 . 
整数 线性 规划 的 一 般 形 式 是 
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min cx 
st Az 二 6 
并 之 0， 整数 


其 中 ,A 是 mxn 的 整数 矩阵,b 是 mm 维 整数 列 向 量 , c 是 n 维 整 数列 向 量 ,z 是 待定 的 n 维 
列 向 量 . 对 应 的 判定 问题 要 添加 一 个 整数 4, 问 是 否 存 在 非 负 整数 向 量 x 使 得 Az 宇 6 且 
cTzs<d? 把 crzsd 写成 一 cx 宇 一 d， 也 看 成 一 个 约束 条 件 , 可 以 与 原 有 的 约束 条 件 合 并 到 
一 起 . 于 是 , 对 应 的 判定 问题 可 写成 下 述 形式 . 
整数 线性 规划 (CILP) 任 给 六 关 7 维 整数 矩阵 A 和 wm 维 整 数 向 量 5, 问 下 述 问题 
Az 之 1 
工 宇 0， 整数 A) 


是 否 有 解 ? 

引 理 9%.2 ILP 是 NP 难 的 . 

证 很 多 NP 完全 问题 都 可 以 表示 成 整数 线性 规划 , 从 而 证 明 它 是 NP 难 的 . 这 里 选 
择 0-1 背包 , 要 把 0-1 背包 多 项 式 时 间 变 换 到 ILP. 任 给 件 物品 和 一 个 背包 , 物品 i 的 重 
量 为 w;、 价 值 为 v;, 1 二 i<n, 背包 的 重量 限制 为 B. 价值 的 目标 为 K, 问题 可 表示 成 


Se 1 
i=l 
Sg, 2 
i=1 


wi = 0s1 < 

显然 这 是 0-1 背包 到 ILP 的 多 项 式 时 间 变 换 . 

证 明 ILP 属于 NP 的 主要 困难 是 , 如 果 不 等 式 组 (9. 1) 的 解 中 有 很 大 的 数 , 这 样 的 解 不 
能 作为 证 据 , 因为 不 能 保证 验证 可 以 在 多 项 式 时 间 内 完成 . 因此 需要 证 明 , 如 果 不 等 式 组 
(9.1) 有 解 , 则 一 定 存在 每 个 数 都 不 很 大 的 解 . 为 此 , 先 证 明 几 个 引 理 . 

记 A 的 第 ;行为 Ai,1 委 i 委 ia 一 max{( laj| : 1 委 i 委 1<j<n}, B=max{ | 六 | : 
1<i<m)}. 

引 理 9.3 设 B 是 A 的 一 个 ~ 阶 子 方 阵 , 则 |det(B)| 志 (re)". 
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证 det(B) 有 r! 项 , 每 一 项 是 B 中 个 元 素 的 乘积 . 其 绝对 值 不 超过 a”, 故 
| det(B) | 过 rl ,ar < (rma) 

引 理 9.4 设 A 的 秩 为 上 如 果 1 达 二 n, 则 存在 非 零 整数 向 量 < 使 得 A< 一 0 且 
[zl (nea)" ,1<j<n. 

证 不 妨 设 A 的 左上 角 r 阶 子 方 阵 B 的 秩 等 于 ~. 把 A 的 前 x 行 记 作 C, 后 mm 一 r 行 记 
作 D. 由 于 A 的 秩 等 于 r, C 的 r 行 是 A 的 m 行 的 极 大 线性 无 关 组 , 故 存在 (m 一 r) Xn 的 
矩阵 P 使 得 DD 二 PC. 若 Cz=0, 则 Dz 二 PCz 二 0. 因此 , 只 要 Cz=0, 就 有 Az 一 0. 

考虑 线性 方程 组 


之 一 0 
取 zx 一 一 det(B)，xrH 一 … 一 xi 一 0, 注意 到 C 的 前 x 列 是 B, 方程 组 可 写成 
By = det(B)C, 

其 中 ,y= 二 (Cz,…*,z,)T， GC, 是 C 的 第 n 列 . 由 Cram 法 则 , 上述 线性 方程 组 有 唯一 的 解 
z; = det(B,), l1<j<r 
其 中 Bi 是 用 C, 替换 B 的 第 j 列 后 得 到 的 方 阵 . 根据 引 理 9. 3， 

| 名 [Ga LS 

引 理 9.5 设 A 的 秩 等 于 n. 如果 Az>/ 有 整数 解 , 则 存在 整数 解 z 和 A 的 & 行 (不 
妨 设 为 Ai ,A,，,…,A) 使 得 
b; < Ax <b na)"t, lk 


且 这 A 行 的 秩 等 于 7 
证 设 x” 是 一 个 整数 解 , 不妨 设 
b;: Ax® <bit na)"t, ls 
Ar bn , s<i<m 
记 C 为 * 行 Ai,A:,…,'A, 构 成 的 矩阵 ,如果 C 的 秩 等 于 n, 则 引 理 已 经 得 证 . 否则 由 引 
理 9.4, 当 ;s 宇 1 时 , 存在 非 零 整数 向 量 > 使 得 Cz 二 0 且 < 的 每 一 个 分 量 的 绝对 值 都 不 超过 
(na)". 当 s 二 0 时 , 取 z==((na)",…， (na)"). 于 是 , 对 任意 的 整数 d， 
Ai(zo +adz) = Ax, l<i<s 
Ai(zo +dz) = Ax +dAxz, s<i<m 
由 于 |Ajw | 二 nana)" 和 (ra)" 和 1 及 当 i 六 ;时 Air 中 本 bi 十 (na)"11, 可 以 选取 qd 使 得 
Mtme td) SW Fs 


且 至 少 有 一 个 达 * 使 得 
久生 A(Czo dz) b+ na)"t 
不 妨 设 当 ;二 ts 时 ， 


b: A(r dz) b+ na)"t 
邻 zD=z 中 十 dz, 有 
于 和 Aiz bt (na)"t!, i 
Aixw EC siSm 
这 里 ss 
以 zx 代替 x 中 ,以 Ai,As,…,A,' 代 蔡 Ai.,A:,…,A,, 重复 上 述 过 程 , 经 过 有 限 次 一 
定 可 以 得 到 引 理 所 要 求 的 x 和 A 的 & 行 . 
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引 理 9.6 如 果 式 (9. 1) 有 解 , 则 存在 一 个 解 x 使 得 每 一 个 分 量 x; 硅 B (na)*”， 


1<j<n. 
证 令 
:< 
到 0 
A 是 Gn 十 n) X 的 整数 矩阵 , 它 的 下 方 是 一 个 阶 单位 矩阵 , 秩 等 于 n, 5 是 mw 十 n 维 向 
量 , 它 的 后 n 个 分 量 都 是 0. 显然 , 式 (9. 1) 可 写成 
Azr 宇 6 C92) 
根据 引 理 9.5, 如 果 式 (9.2) 有 整数 解 , 则 存在 非 负 整数 解 x 和 A 的 k 行 , 不 妨 设 为 
入 ,A015Ais 使 得 
Axo li 
且 Ai;A;，…,A, 的 秩 等 于 nn. 
不 妨 设 Ai ,As，,… ,A, 的 秩 等 于 n. 令 ci 二 Aix， 有 6 二 ;过 bi 十 (na)"! ,1 二 i 性 n. 由 于 
Ail,As，…,A, 的 秩 等 于 n，, 给 定 co ,cs，…,c,， 线性 方程 组 
Br=e 
有 唯一 解 , 其 中 B 是 Ai,A,,…,A, 构 成 的 方 阵 ,c 二 (a ,co，…,c,) "把 B 的 第 j 列 换 成 c 得 
到 的 方 阵 记 作 B;, 根据 Cram 法 则 ， 
Xi =det(B;)/det(B) <| det(B,) | 
<nla™ (p+ (na)"™t!) 
(na)™1 (B+ (na)™!) 
Bna)’” 


这 里 1<&j<<n. 

定理 9.20 ILP 是 NP 完全 的 . 

证 引 理 9.2 已 经 证 明 ILP 是 NP 难 的 , 现在 证 明 ILP eNP. 

根据 引 理 9. 6, 下 述 过 程 是 ILP 的 非 确定 型 算法 : 猜想 一 个 维 非 负 整数 向 量 x, 它 的 
每 一 个 分 量 zx; 三 p(na)*", 1 二 j 二 n. 车 Az 宇 b, 则 回答 “Yes”, 否则 回答 “No”. 

ILP 的 实例 I 的 规模 取 作 |T| = 二 mn 十 logs (max(a,B))， 注意 到 猜想 的 zj 的 二 进 制 表示 
的 长 度 不 超过 


logz (B(na)™”)++1 = 2nlog: (na) 二 logzB++1 

上 述 过 程 可 以 在 |1| 的 多 项 式 时 间 内 完成 . 

小 结 ”证 明 一 个 问题 是 NP 难 的 ,首先 要 选 好 一 个 已 知 的 NP 完全 问题 . 在 理论 上 , 任 
何 一 个 NP 完全 问题 都 可 以 多 项 式 时 间 变 换 到 一 个 NP 难 的 问题 .但 实际 上 ,要 找到 一 个 便 
于 做 多 项 式 时 间 变 换 的 已 知 NP 完全 问题 有 时 并 不 是 一 件 容易 的 事 . 常用 的 证 明 方 法 有 限 
制 法 ` 局 部 替换 法 和 构件 设计 法 . 当 限 制 问题 了 的 实例 满足 某 些 条 件 时 得 到 的 子 问 题 x' 已 
知 是 NP 完全 的 ,那么 很 容易 把 x' 多 项 式 时 间 变 换 到 问题 五 ,这 就 是 限制 法 . 当然 ,x 在 形式 
上 不 一 定 是 原 问题 的 子 问题 .而 是 等 价 于 原 问题 的 某 个 子 问 题 . 如 前 面 看 到 的 那样 ,SAT 可 
以 看 作 最 大 可 满足 性 的 子 问 题 . 子 集 和 可 以 看 作 0-1 背包 的 子 问题 . 对 于 这 种 情况 ,NP 完全 
性 证 明 是 比较 简单 的 .我 们 应 该 能 够 识别 出 来 . 反 过 来 ,如 果 已 知 一 个 问题 是 NP 完全 的 ,要 


击 必 器 
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证 明 它 的 子 问题 也 是 NP 完全 的 (如 果 这 个 子 问 题 确实 是 NP 完全 的 话 ) 通 常 就 没有 这 么 容 
易 了 .一 般 地 ,往往 可 以 用 局 部 替换 法 证 明 , 把 原 问题 实例 中 的 某 种 “基本 单位 ”替换 成 满足 
给 定 限制 的 子 问题 的 结构 ,如 定理 9. 9 证 明 中 SAT 到 3SAT 和 定理 9. 13 证 明 中 有 向 HC 到 
HC 的 多 项 式 时 间 变 换 . 更 一 般 地 ,如 果 两 个 问题 实例 的 构造 有 某 种 相似 之 处 ,往往 也 可 以 
采用 局 部 替换 法 . 在 前 两 种 方法 都 失效 的 情况 下 ,就 不 得 不 采用 构件 设计 法 . 应 用 构件 设计 
法 证 明 NP 完全 性 需要 更 强 的 技巧 ,3SAT 由 于 其 简单 整齐 的 结构 常常 被 用 做 已 知 的 NP 完 
全 问题 . 

除 上 述 常用 的 NP 完全 性 证 明 方 法 外 ,还 有 一 种 “最 一 般 性 的 ”方法 , 即 根据 定义 ,把 任 
意 一 个 NP 问题 多 项 式 时 间 变 换 到 待 证 明 的 问题 . 证 明 “ 第 一 个 ”NP 完全 问题 无 疑 必 须 使 
用 这 种 方法 ,即使 在 已 知 许多 NP 完全 问题 之 后 ,有 时 也 会 需要 使 用 这 种 方法 . 

证 明 NP 完全 性 与 设计 多 项 式 时 间 算 法 是 一 个 问题 的 两 个 方面 . 对 一 个 新 问题 ,通常 首 
先 想到 的 是 设计 一 个 多 项 式 时 间 算 法 . 如 果 在 经 过 一 番 努 力 之 后 设计 失败 ,你 可 能 必须 考虑 
它 是 不 是 可 能 是 NP 完全 的 或 NP 难 的 . 而 事实 上 ,算法 设计 的 失败 可 能 使 你 对 问题 的 难度 
有 新 的 认识 ,从 而 启发 你 产生 证 明 NP 完全 性 的 思路 . 同样 ,如 果 NP 完全 性 证 明 失 败 ,也 可 
能 启发 你 设计 算法 的 新 想法 . 问题 的 最 后 解决 也 许 就 在 这 两 种 努力 的 交替 之 中 ,切忌 抱 着 一 
种 努力 不 放 . 

如 果 一 个 组 合 优化 问题 或 搜索 问题 对 应 的 判定 问题 是 NP 完全 的 (更 广泛 地 ,是 NP 难 
的 ), 则 说 这 个 问题 是 NP 难 的 .证 明了 一 个 问题 是 NP 难 的 ,在 很 大 程度 上 表明 这 个 问题 很 
可 能 是 难 解 的 . 正如 本 章 一 开始 所 说 的 那样 ,在 实际 应 用 中 有 许多 这 样 的 问题 ,并 不 能 因为 
是 NP 难 的 就 不 去 解决 它们 . 经 过 近 几 十 年 的 努力 ,在 如 何 处 理 NP 难 的 问题 方面 取得 了 很 
大 进展 . 四 采用 近似 算法 . 对 于 NP 难 的 优化 问题 ,由 于 普遍 相信 不 可 能 在 多 项 式 时 间 内 找 
到 最 优 解 ,故而 求 其 次 ,不 一 定 非 要 最 优 解 ,只 要 是 足够 好 的 可 行 解 就 可 以 了 . 也 就 是 说 ,用 
降低 对 解 的 要 求 来 换取 时 间 . 这 些 内 容 将 在 第 10 章 中 介绍 .加 设计 出 一 些 通 用 的 算法 ,能 相 
当 有 效 地 求解 NP 难 问题 ,如 模拟 退火 算法 、 遗 传 算法 等 ,以 及 采用 指数 时 间 算法 和 进行 子 
问题 分 析 等 . 第 12 章 将 阐述 这 些 应 对 策略 . 


习 题 9 


9.1 写 出 下 述 优化 问题 对 应 的 判定 问题 : 
(1) 最 长 回路 问题 : 任 给 无 向 图 G. 求 G 中 一 条 最 长 的 初级 ( 即 顶点 不 重复 的 ) 回 路 . 
(2) 多 机 调度 问题 : 任 给 有 穷 的 作业 集 A 和 wm 台 相 同 的 机 器 ,作业 a 的 处 理 时 间 为 正 
整数 i(a) ,每 一 项 作业 可 以 在 任 一 台 机 器 上 完成 . 如 何 把 作业 分 配给 机 器 才能 使 
完成 所 有 作业 的 时 间 最 短 ? 即 :如 何 把 A 划分 成 mr 个 不 相交 的 子 集 A; 使 得 
max { Da) |i= 1.2,° mm} 


aEAi 


T 


最 小 ? 
图 着 色 问 题 : 任 给 无 向 图 G 一 <V.E>, 给 G 的 每 一 个 顶点 涂 一 种 颜色 ,要 求 任 
条 边 的 两 个 端点 的 颜色 都 不 相同 . 如 何 用 最 少 的 颜色 给 G 的 顶点 着 色 ? 即 求 映 射 


(3 


< 


避 加 


‘© 避 
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NP 完 会 性 


J:V 一 Z+ 满 足 条 件 V (u,v)EE,f(w) 隆 f(v), 且 使 |1{f(u)1uEV})| 最 小 . 

给 出 下 述 判定 问题 的 简短 证 据 , 证 明 它 们 属于 NP. 

(1) 子 图 同 构 : 任 给 两 个 图 G 二 二 V,E 这 和 及 = 过 Vi. 瑟 请 ; 问 : 日 与 G 的 一 个 子 图 同 
构 吗 ? 即 存在 单 射 /:Vi 一 V 使 得 Vu,v€Vi,(u,wDEE> (f(w),f(vw))EE? 

(2) 度数 有 界 的 生成 树 : 任 给 一 个 连通 图 G 和 正 整 数 忆 .: 问 : G 有 一 棵 顶点 度数 不 超 
过 的 生成 树 吗 ? 

证 明 在 题 9. 1 中 你 给 出 的 判定 问题 属于 NP. 

设 判定 问题 也 = 一 D,Y 二 , 称 五 = 一 D,.D 一 Y 过 为 开 的 补 问 题 , 即 对 每 一 个 实例 T.T 在 

五 中 的 答案 为 “Yes” 当 上 且 仅 当 了 在 工 中 的 答案 为 “No”. 

试 给 出 HC 的 补 问题 HC, 又 问 : 你 能 给 出 HC 的 简短 证 据 ,并 证 明 HCE NP 吗 ? 为 

休 众 受 

给 出 下 述 问题 之 间 的 多 项 式 时 间 变 换 ， 

(1) 独立 集 到 团 . 

(2) VC 到 团 . 

(3) HC 到 子 图 同 构 . 

(4) 团 到 0-1 整数 规划 ,其 中 0-1 整数 规划 : 给 定 mx Xn 的 整数 矩 阵 A ,n 维 整数 列 向 
量 c ,zz 维 整 数列 向 量 5b 以 及 整数 DD, 问 : 是 否 存在 nn 维 0-1 列 向 量 z, 使 得 Azr<b 
有 cz>D? 

这 里 向 量 和 (三 ) 表示 a 的 每 一 个 分 量 三 (三 6 的 每 一 个 分 量 

设 厂 三 ,I ,证 明 ， 

(1) 车 [EP. 则 II€EP; 

(2) 车 II ENP, 则 IL ENP. 

证 明 : 如 果 存 在 NP 难 的 问题 IEP. 则 P= 二 NP. (定理 9.4) 

证 明 : 假设 P 取 NP. 那么 ,如 果 荆 是 NP 难 的 , 则 了 P. (推论 9. 2) 

证 明 : 如 果 存 在 NP 难 的 问题 了 使 得 二, 了, 则 荆 是 NP 难 的 . (定理 9.5) 

证 明 : 如 果 IE NP 并且 存 在 NP 完全 问题 了 使 得 了’ 二, 了 , 则 并 是 NP 完全 的 . ( 推 

论 9. 3) 

有 向 哈密 顿 通路 (有 向 HP): 给 定 有 向 图 刀 . 经 过 了 中 每 一 个 顶点 恰好 一 次 的 通路 称 

作 哈 密 顿 通路 . 问 : D 中 有 一 条 哈密 顿 通 路 吗 ? 

仿照 定理 9. 12 证 明 中 3SAT 到 有 向 HC 的 多 项 式 时 间 变 换 构造 3SAT 到 有 向 HP 的 

多 项 式 时 间 变 换 . 

构造 有 向 HC 到 有 向 HP 的 多 项 式 时 间 变 换 

构造 有 向 HP 到 HP 的 多 项 式 时 间 变 换 . 哈密 顿 通路 (HP) 是 有 向 HP 的 无 向 图 形式 . 

证 明 下 面 题 9. 14 一 9. 20 中 叙述 的 问题 是 NP 完全 的 . 

划分 : 任 给 个 正 整 数 a1.a;,….a,: 问 : 能 把 这 个 数 分 成 和 相等 的 两 部 分 吗 ? 即 

存在 子 集 TESTI=={1,2,…,n) 使 得 >)a; = > ai 吗 ? 

iET 


到 天下 
子 图 同 构 . (定义 见 题 9. 2) 
度数 有 界 的 生成 树 . (定义 见 题 9. 2) 


第 
9 
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9.17 最 长 通路 : 任 给 无 向 图 G= 二 二 V,E 二 和正 整数 K 三 IV|, 问 : G 中 存在 边 数 不 少 于 K 
的 初级 ( 即 顶点 不 重复 的 ) 通 路 吗 ? 

9.18 反馈 顶点 集 : 任 给 有 向 图 D 二 二 V,E 放 和 正 整 数 K 三 |V|, 问 : 存在 子 集 V'SV 使 得 
IV'|K ,并且 D 中 的 每 一 条 回路 上 至 少 有 一 个 V 的 顶点 吗 ? 

9. 19 支配 集 : 任 给 无 向 图 G 二 二 V ,E> 和 正 整 数 K 三 |V1, 问 : 存在 子 集 V' SV 使 得 
IV'1<K, 并 且 V 一 V 中 的 每 一 个 顶点 都 至 少 与 V' 中 的 一 个 顶点 相 邻 吗 ? 

9.20 可 着 三 色 : 任 给 无 向 图 G 王 一 V.E>>, 问 : G 是 可 着 三 色 的 吗 ? 即 存在 函数 f:V 一 
{1,2,3} 使 得 VYV (u,v)EE 且 wu 了 关 v, 有 ff(w) 关 f(v) 吗 ? 


第 章 
一]10 近似 算法 


10.1 近似 算法 及 其 近似 比 


在 第 9 章 已 经 看 到 ,很 多 组 合 优化 问题 对 应 的 判定 问题 是 NP 完全 的 ,它们 不 可 能 有 多 
项 式 时 间 的 最 优化 算法 ,除非 P= NP. 但 是 ,不 能 因此 而 不 去 解决 这 些 问题 ,因为 它们 都 是 
实际 中 提出 的 重要 问题 . 既然 不 能 在 多 项 式 时 间 内 找到 最 优 解 ,只 好 求 其 次 ,去 找 一 个 满意 
的 可 行 解 . 其 实 , 在 实际 中 也 不 一 定 非 要 最 优 的 ,往往 只 要 足够 好 的 就 可 以 了 . 因此 ,近似 算 
法 是 解决 NP 难 的 组 合 优化 问题 的 一 条 重要 途径 . 

设 组 合 优化 问题 了 ,A 是 一 个 多 项 式 时 间 算 法 . 如 果 对 工 的 每 一 个 实例 T, 算 法 A 输出 
I 的 一 个 可 行 解 o, 则 称 A 是 工 的 近似 算法 . 记 A(DT)=c(c) ,其 中 c(c) 是 ce 的 值 .如 果 恒 有 
A(T) 二 OPT(D, 即 A 总 是 输出 了 的 最 优 解 , 则 A 是 荆 的 最 优化 算法 . 

当 五 是 最 小 化 问题 时 , 记 


A 
AD = OPTD 
当 瑟 是 最 大 化 问题 时 , 记 
_ OPT(D 
FrA(T) = ACD 


如 果 对 本 的 每 一 个 实例 ,ra (DD 三 7, 则 称 近似 算法 A 的 近似 比 为 :又 称 A 是 斑 近似 算法 . 
当 7 是 一 个 常数 时 , 称 A 具有 常数 比 . 

显然 ,近似 算法 的 近似 比 r 三 1. 并 且 越 接近 1 越 好 . NP 难 的 组 合 优化 问题 按 可 近似 性 
可 分 成 3 类 : 

(1) 对 任意 小 的 s 字 0 ,存在 (1 二 e) -近似 算 法 . 此 时 称 问题 是 完全 可 近似 的 . 

(2) 存在 具有 常数 比 的 近似 算法 . 此 时 称 问题 是 可 近似 的 . 

(3) 不 存在 具有 常数 比 的 近似 算法 ,除非 了 二 NP. 此 时 称 问题 是 不 可 近似 的 . 

上 述 分 类 的 前 提 是 假设 P 了 NP. 另外 ,不 可 近似 的 问题 并 不 是 没有 近似 算法 ,而 是 没有 
具有 常数 比 的 近似 算法 .它们 可 能 有 近似 比 为 logn 或 n 的 近似 算法 ,其 中 是 实例 的 规模 . 


下 面 考虑 顶点 覆盖 对 应 的 优化 问题 最 小 顶点 覆盖 问题 : 任 给 一 个 图 G 一 二 V, 下 二， 
求 G 的 顶点 数 最 少 的 顶点 覆盖 . 
算法 MVC: 


开始 时 令 V' 一休. 任 取 一 条 边 (x,o) ,把 w 和 w 加 入 V' 并 删 去 w 和 w 及 其 关联 的 边 .重复 上 述 过 程 , 直 
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到 删 去 所 有 的 边 为 止 ,最 后 输出 V'.V "为 所 求 的 项 点 覆盖 . 


显然 ,算法 MVC 的 时 间 复 杂 度 为 OQm), 其 中 以 二 1E1|. 记 |V | 二 2k,V 中 的 顶点 是 
& 条 边 的 端点 ,这 A 条 边 互 不 关联 . 为 了 覆盖 这 & 条 边 需要 A 个 顶点 ,从 而 OPT(T) 宇 k. 于 是 ， 


MVC(DT) 2k 
要 些 = 
OPT(I) ~&k 2 


故 MVC 是 最 小 项 点 覆盖 问题 的 2- 近 似 算法 . 
设 图 G 由 k 条 互 不 关联 的 边 构 成 ,对 于 这 个 实例 I, 显然 MVC(D 一 24,OPT(CT) 一 A， 


站 全 一 2. 这 表明 上 面 估计 的 MVC 的 近似 比 已 不 可 能 再 进一步 改进 , 即 MVC 的 近似 比 


不 会 小 于 2. 

从 这 个 简单 的 例子 我 们 看 到 了 研究 近似 算法 的 两 个 基本 方面 一 -设计 算法 和 分 析 算 法 
的 近似 比 . 近似 算法 通常 是 很 简单 的 ,设计 思想 常常 来 源 于 直觉 或 者 某 种 物理 现象 .社会 现 
象 ,甚至 日 常生 活 中 的 常识 .分 析 算法 的 近似 比 的 关键 是 估计 最 优 解 的 值 ,这 也 是 困难 所 在 . 
我 们 不 可 能 真正 知道 最 优 解 的 值 ,必须 给 出 它 的 上 界 ( 对 最 大 化 问题 ) 或 下 界 ( 对 最 小 化 问 
题 ) ,而 这 个 界限 的 好 坏 往往 决定 了 所 得 到 的 近似 比 的 质量 . 给 出 近似 比 后 ,还 要 设法 构造 使 
算法 产生 最 坏 的 解 的 实例 . 如 果 这 个 解 的 值 与 最 优 值 的 比 达到 或 者 可 以 任意 地 接近 得 到 的 近 
似 比 ,那么 说 明 这 个 近似 比 已 经 是 最 好 的 ,不 可 改进 的 了 ;否则 还 有 进一步 的 研究 余地 . 通过 分 
析 近 似 比 , 找 到 产生 坏 的 解 的 原因 ,这 又 有 可 能 启发 我 们 改进 算法 ,得 到 更 好 的 近似 比 , 使 算法 
产生 的 解 值 与 最 优 值 之 比 等 于 或 可 以 任意 接近 近似 比 的 实例 称 作 紧 实 例 . 例如 上 面 由 条 互 
不 关联 的 边 构成 的 图 G 是 MVC 的 近似 比 为 2 的 紧 实 例 . 在 得 到 算法 的 近似 比 后 ,我 们 总 希望 
能 够 构造 出 一 个 紧 实例 ,以 说 明 这 个 近似 比 已 是 最 好 的 了 . 除 此 之 外 ,还 应 该 研究 问题 本 身 的 
可 近似 性 , 即 在 P 才 NP 的 (或 其 他 更 强 的 ) 假 设 下 ,该 问题 近似 算法 的 近似 比 的 下 界 , 下 面 将 通 
过 几 个 具体 问题 来 阐述 . 


10.2 多 机 调度 问题 


多 机 调度 问题 : 任 给 有 穷 的 作业 集 A 和 m 台 相 同 的 机 器 ,作业 a 的 处 理 时 间 为 正 整数 
t(a) ,每 一 项 作业 可 以 在 任 一 台 机 器 上 处 理 . 如 何 把 作业 分 配给 机 器 才能 使 完成 所 有 作业 的 
时 间 最 短 ? 即 如 何 把 A 划分 成 m 个 不 相交 的 子 集 A; ,使 得 


max {Ze) | 县 省 一 1 2 
aeAi 
最 小 ? 
双 机 调度 是 对 应 这 个 问题 m= 二 2 时 的 判定 问题 ,在 9. 3. 5 节 中 已 经 证 明 它 是 NP 完全 
的 , 故 多 机 调度 问题 是 NP 难 的 . 
10.2.1 贪心 的 近似 算法 


把 分 配给 一 台 机 器 的 作业 的 处 理 时 间 之 和 称 作 这 台 机 器 的 负载 . 多 机 调度 问题 是 要 使 
m 台 机 器 的 负载 尽 可 能 的 均衡 . 基于 这 个 认识 . 先 考虑 一 个 很 简单 的 贪心 算法 . 
贪心 法 (G-MPS) : 按 输入 的 顺序 分 配 作业 ,把 每 一 项 作业 分 配给 当前 负载 最 小 的 机 器 . 


近似 算法 


如 果 当 前 负载 最 小 的 机 器 有 2 台 或 2 台 以 上 , 则 分 配给 其 中 的 任意 一 台 0 
例如 ,有 3 台 机 器 ,8 项 作业 的 处 理 时 间 分 别 为 3,4,3,6,5,3,8,4. 算 法 分 配给 3 台 机 器 2 
的 作业 分 别 为 {1,4},{2,6,7},{3,5,8) ,负载 分 别 为 3 十 6 一 9,4 十 3 十 8 王 15,3 十 5 十 4 一 12， 和 


完成 时 间 为 15. 显然 ,i ee 最 优 方案 是 {1,3,4),{2,5,6),{7,8) ,负载 分 
别 为 3 十 3 十 6 二 12,4 十 5 十 3 二 12,8 十 4 二 12, 完 成 时 间 为 12. 
定理 10.1 对 多 机 调度 问题 的 每 一 个 有 mm 台 机 器 的 实例 了 I， 


G-MPS(D) < (2 one 


证 首先 ,下 述 事 实 是 显然 的 : (1) OPT(D 宇 二 ad (2)OPT(D 之 maxt (a). 


aEA 


设 机 器 Mi 的 负载 最 大 , 即 G-MPS(T) = :CO ) ,其 中 zxCOMi) 是 Mi 的 负载 .又 设 0 是 最 
后 被 分 配给 机 器 Mi; 的 作业 . 根据 算法 ,在 考虑 分 配 2 时 Mi 的 负载 最 小 , 故 有 :COM ) 一 上 (0) 过 


让 (Dc) 一 (0). 于 是 


aEA 


G-MPS(D= :COM)) < (De) 1(0) ) 十 10) 
aEA 
= Da)+ @ 一 让] 
m en 


<OPTCD+(1- 十 JoPTCD 


= (2 一 去 ]oPTCD 


G-MPS 显然 是 多 项 式 时 间 的 . 下 述 实例 工 是 一 个 紧 实 例 : m 台 机 器 ,m(m 一 1) 十 1 项 作 
业 , 前 mxlm 一 1) 项 作业 的 处 理 时 间 都 为 1, 最 后 一 项 作业 的 处 理 时 间 为 m. 算法 把 前 mm 一 1) 
项 作业 平均 地 分 配给 m 台 机 器 ,每 台 m 一 1 项 ,最 后 一 项 任意 地 分 配给 一 台 机 器 . 显然 ， 
G-MPS(D 一 22 一 1. 而 最 优 的 分 配方 案 是 把 前 m(m 一 1) 项 作业 平均 地 分 配给 m 一 1 台 机 
器 ,每 台 m 项 ,最 后 一 项 分 配给 留 下 的 那 台 机 器 .OPT(71) 二 mm. 得 


G-MPS(1) = (2 一 二 JoPTcD 
由 于 加 可 以 任意 地 大 ,这 个 比值 可 以 任意 地 接近 2,G-MPS 是 一 个 2- 近 似 算法 . 
10.2.2 改进 的 贪心 近似 算法 


分 析 10. 2. 1 节 最 后 给 出 的 紧 实 例 ,发 现 使 算法 性 能 变 坏 的 原因 是 处 理 时 间 长 的 作业 被 
放 在 了 最 后 分 配 ,如 果 反 过 来 , 先 分 配 处 理 时 间 长 的 作业 , 则 得 到 最 优 解 . 受 这 个 启发 ,把 上 
述 贪心 算法 改进 成 下 述 递 降 贪心 近似 算法 , 它 的 近似 性 能 确实 好 于 原来 的 贪心 近似 算法 . 

递 降 贪心 法 (DG-MPS) : 首先 按 处 理 时 间 从 大 到 小 重新 排列 作业 ,然后 运用 G-MPS. 

把 这 个 算法 运用 到 10. 2. 1 节 最 后 给 出 的 紧 实 例 得 到 最 优 解 . 运用 到 前 面 的 实例 ,结果 
如 下 : 先 重新 排序 ,8,6,5,4,4,3,3,3;3 台 机 器 的 负载 分 别 为 8 十 3 一 11,6 十 4 十 3 一 13， 
5 十 4 十 3 二 12. 比 G-MPS 的 结果 好 . 

与 G-MPS 相 比 ,DG-MPS 仅 增加 对 作业 的 排序 .需要 增加 时 间 O(nlogn) ,仍然 是 多 项 
式 时 间 的 . 


算法 设计 与 分 析 ( 盆 2 版 ) 


定理 10.2 对 多 机 调度 问题 的 每 一 个 有 m 台 机 器 的 实例 工 , 


DG-MPS(D 去 3 = ;OPTD 
3 2m 


证 设 作 业 按 处 理 时 间 从 大 到 小 排列 为 ai ,as,…,a,, 仍 考虑 负载 最 大 的 机 器 Mi 和 最 
后 分 配给 AM 的 作业 ai. 只 有 两 种 可 能 : (1)M; 只 有 一 个 作业 . 此 时 必 有 ;一 1, 显 然 这 个 分 配 
方案 是 最 优 解 ,从 而 DG-MPS(1) 二 OPT(D. (2)M 有 2 个 或 2 个 以 上 作业 .此 时 必 有 i 二 
Mm 十 1, 从 而 OPT(D 宇 2i(am+1). 和 定理 10. 1 证 明 中 一 样 ,唯一 不 同 的 是 i(4i) 志 i(amn) 三 
i 


二 PTD; 于 是 
DG-MPS(D= 4M) = 工 [ Sue) ia) ]+ (as) 
让 1 
= 二) +( 一 十]'*ep 
三 OPTCD 二 (1 一 二 去 OPTCD 
3 _ 1 
二 ( 宇 -= 盐 joPr 
定理 表明 DG-MPS 是 多 机 调度 问题 的 这 -近似 算法 . 
10.3 货 郎 问题 
本 节 考 虑 满足 三 角 不 等 式 的 货 郎 问题 , 即 对 任意 的 3 个 城市 i,j.&, 它 们 之 间 的 距离 满足 
三 角 不 等 式 


d(i,j) + d(j.k) 之 CC) 


10.3.1 最 邻近 法 


最 邻近 法 (NN) : 从 任意 一 个 城市 开始 ,在 每 一 步 取 离 当前 所 在 城市 最 近 的 尚未 到 过 的 城 
市 作为 下 一 个 城市 . 车 这 样 的 城市 不 止 一 个 , 则 任 取 其 中 的 一 个 . 直 
至 走 遍 所 有 的 城市 ,最 后 回 到 开始 出 发 的 城市 . 

这 是 一 种 贪心 法 ,是 人 们 一 开始 最 容易 想到 的 方法 . 初 看 起 来 
这 个 方法 似乎 非常 合理 ,至 少 不 会 太 坏 . 但 实际 上 , 它 不 仅 不 能 保证 
得 到 最 优 解 ,而 且 算法 的 近似 性 能 也 很 不 好 . 

图 10. 1 给 出 一 个 实例 表明 最 邻近 法 的 性 能 可 能 很 坏 , 有 15 个 
城市 (顶点 ) ,图 中 没有 画 出 边 的 两 点 之 间 的 距离 等 于 这 两 点 之 间 最 
短路 的 长 度 ,城市 之 间 的 距离 满足 三 角 不 等 式 . 最 优 巡 回路 线 是 沿 最 图 lo.1 一 个 表明 NN 性 
外 的 圆周 走 一 圈 ,OPT (TI) = 15. 粗 黑 线 是 NN 给 出 的 解 ， 能 很 坏 的 实例 
NN(D 王 27. 关 于 最 邻近 法 的 近似 性 能 有 下 述 定理 . 

定理 10.3 ”对 于 货 郎 问题 所 有 满足 三 角 不 等 式 的 对 个 城市 的 实例 ,总 有 


NNCD) < 去 (Nogn HH 1)OPT(D 


近似 算法 


而 且 , 对 于 每 一 个 充分 大 的 ,存在 满足 三 角 不 等 式 的 个 城市 的 实例 I 使 得 
NND > 去 [omo+D + 全 ]OPT(D 
定理 表明 最 邻近 法 的 近似 比 可 以 任意 大 . 定理 的 证 明 略 去 . 
10.3.2 最 小 生成 树 法 


把 货 郎 问题 的 实例 看 作 一 个 带 权 的 完全 图 ,要 找 一 条 最 短 的 哈密 顿 回路 . 下 面 给 出 两 个 性 
能 比 最 邻近 法 好 得 多 的 近似 算法 . 

最 小 生成 树 法 (MST) : 首先 , 求 图 的 一 棵 最 小 生成 树 T. 然后 , 沿 着 工 走 两 遍 得 到 图 
的 一 条 欧 拉 回路 . 最 后 , 顺 着 这 条 欧 拉 回 路 , 跳 过 已 走 过 的 顶点 , 抄 近 路 得 到 一 条 哈密 
顿 回路 . 
图 10.2 给 出 MST 计算 过 程 的 示意 图 . 由 于 求 最 小 生成 树 和 欧 拉 回路 都 可 以 在 多 项 式 
时 间 内 完成 , 故 算法 是 多 项 式 时 间 的 .有 关 的 图 论 知 识 可 参见 参考 文献 [1]. 


SA 


| 


o 


最 小 生成 树 7 走 两 侦 得 到 抄 近 路 得 到 
欧 拉 回 路 哈密 顿 回路 


图 10.2 最 小 生成 树 法 


定理 10.4 对 货 郎 问题 的 所 有 满足 三 角 不 等 式 的 实例 I, 有 
MST(T) 二 20PT(D) 

证 ”因为 从 哈密 顿 回路 中 删 去 一 条 边 就 得 到 一 棵 生成 树 , 故 最 小 生成 树 T 的 权 小 于 最 
短 哈密 顿 回 路 的 长 度 OPT(T). 于 是 ,. 沿 工 走 两 遍 得 到 的 欧 拉 回路 的 长 小 于 2OPT(D). 最 
后 ,由 于 图 的 边 长 满足 三 角 不 等 式 , 抄 近 路 不 会 增加 长 度 , 故 MST(D 二 2OPT(D)， 

定理 表明 MST 是 2- 近 似 算法 .图 10. 3 给 出 一 个 紧 实例 I, 有 2n 个 城市 ,OPT(T) 王 27"， 


LR = (: 一 专 ]oPT(D 


实例 7 


最 小 生成 树 


近似 解 
图 10.3 MST 近似 比 为 2 的 紧 实 例 


熙 法 说 计 与 分 新 ( 入 2 版 ) 


这 个 实例 说 明定 理 10. 4 给 出 的 结果 已 是 最 好 的 . 即 对 任意 小 的 s 字 0, 存 在 货 郎 问题 满足 三 
角 不 等 式 的 实例 T, 使 得 MST(D) 二 (2 一 OPT(DT). 


10.3.3 最 小 权 匹 配 法 


最 小 生成 树 法 通过 对 最 小 生成 树 T 的 每 一 条 边 走 两 遍 得 到 一 条 欧 拉 回 路 ,其 实 要 把 
工 改 造成 欧 拉 图 只 需 把 工 中 的 所 有 奇 度 顶 点 变 成 偶 度 顶点 .为 此 ,只 需 在 每 一 对 奇 度 顶点 
( 工 的 奇 度 顶 点 个 数 一 定 是 偶数 ) 之 间 加 一 条 边 ,当然 应 该 使 新 加 的 边 的 权 之 和 尽 可 能 小 . 这 
就 是 最 小 权 匹 配 法 . 

最 小 权 匹 配 法 (MM): 首先 求 图 的 一 棵 最 小 生成 树 T. 记 工 的 所 有 奇 度 顶点 在 原 图 中 
的 导出 子 图 为 五 ,所 有 偶数 个 顶点 , 求 H 的 最 小 匹配 M. 把 M 加 入 TT 得 到 一 个 欧 拉 图 , 求 
这 个 欧 拉 图 的 欧 拉 回 路 ;最 后 , 沿 着 这 条 欧 拉 回路 , 跳 过 已 走 过 的 顶点 , 抄 近 路 得 到 一 条 哈密 
顿 回路 . 

求 任 意图 的 最 小 权 匹 配 是 多 项 式 时 间 可 解 的 (参见 参考 文献 [8]) ,因此 这 个 算法 是 多 项 
式 时 间 的 ， 

定理 10.5 对 货 郎 问题 的 所 有 满足 三 角 不 等 式 的 实例 1, 满足 : 

MM(D) <= 了 OPT(D 


证 ”由 于 满足 三 角 不 等 式 , 导 出 子 图 末 中 的 最 短 哈密 顿 回路 C 的 长 度 不 超过 原 图 中 最 短 
哈密 顿 回路 的 长 度 OPT(D. 沿 着 C 隔 一 条 边 取 一 条 边 , 得 到 厅 的 一 个 匹配 . 总 可 以 使 这 个 匹 


配 的 权 不 超过 C 长 的 一 半 . 因此 , 的 最 小 匹配 M 的 权 不 超过 去 OPTCD. 从 而 求 得 的 欧 拉 回 


路 的 长 小 于 六 OPT( .和 上 面 一 样 , 抄 近 路 不 会 增加 长 度 , 得 证 MM( D<3OPT Ey, 


定理 10.5 表明 MM 是 多 -近似 算法 , 它 的 紧 实 例 留 做 习题 . 当 不 限制 货 郎 问题 的 实例 


满足 三 角 不 等 式 时 ,定理 10.4 和 定理 10. 5 的 证 明 都 失效 ,不 难 给 出 使 这 两 个 近似 算法 得 到 
的 近似 解 的 值 与 最 优 值 的 比 任意 大 的 实例 . 实际 上 ,关于 一 般 的 货 郎 问题 有 下 述 定理 

定理 10.6 货 郎 问题 (不 要 求 满足 三 角 不 等 式 ) 是 不 可 近似 的 ,除非 P= NP. 

证 假设 不 然 , 设 A 是 货 郎 问题 的 近似 算法 ,其 近似 比 r-<K ,其 中 是 一 个 正 整数 ， 

任 给 一 个 图 G 二 二 V,E 二 ,如 下 构造 货 郎 问题 的 实例 I6: 城市 集 V, 记 |V|=n, 每 一 对 
城市 u,vEV 的 距离 为 


7 1 车 (u,v) EE， 
Kn 否则 
若 G 有 哈密 顿 回路 , 则 
OPT(Ic) =n, A(Ic) 入 rOPT(Ie) < Kn 

否则 经 过 V 中 所 有 城市 的 巡回 路 线 中 至 少 有 两 个 相 邻 城市 在 G 中 不 相 邻 ,从 而 OPT(TIc) 过 
Km,A(CIc) 三 OPT(CIc) 之 Km. 所 以 ,G 有 了 哈密 顿 回路 当 且 仅 当 A(16) 志 Kn. 

于 是 ,下 述 算法 可 以 判断 任 给 的 图 G 是 否 有 哈密 顿 回 路 : 首先 构造 货 郎 问题 的 实例 
I6 ,然后 对 Tc 运用 算法 A. 若 ACTIc) 过 Km, 则 输出 “Yes”; 若 ACTc) 二 Kz, 则 输出 “No”. 

注意 到 K 是 固定 的 常数 ,构造 I6 可 在 O(n?) 时 间 内 完成 , 且 |16| 二 O(n?). 由 于 A 是 多 


近似 算法 


项 式 时 间 的 ,n? 的 多 项 式 也 是 nn 的 多 项 式 ,A 对 I6 可 在 n 的 多 项 式 时 间 内 完成 计算 ,所 以 上 
述 算法 是 HC 的 多 项 式 时 间 算 法 . 而 HC 是 NP 完全 的 , 推 得 P 一 NP. 


10.4 背包 问题 


本 节 考 虑 0-1 背包 问题 的 优化 形式 : 任 给 n 件 物 品 和 一 个 背包 ,物品 i 的 重量 为 w;, 价 
值 为 ,1 所 i 委 2 ,背包 的 重量 限制 为 也 ,其 中 ru 以 及 B 都 是 正 整 数 . 把 哪些 物品 装 人 背 
包 才 能 在 不 超过 重量 限制 的 条 件 下 使 得 价值 最 大 ? 即 求 子 集 S 三 {1,2,… ,使 得 


Du 一 max{ Do | Dw 二 {1,2,.,n}} 


iEsS* iES iES 


10.4.1 一 个 简单 的 贪心 算法 


根据 日 常 的 生活 经 验 , 谁 都 知道 应 该 先 装 值钱 的 物品 ,也 就 是 说 应 该 先 装 单位 重量 价值 
大 的 物品 . 此 外 ,还 有 一 种 特殊 情况 ,如 果 有 一 件 物品 的 价值 特别 大 ( 它 的 单位 重量 价值 不 一 
定 是 最 大 的 ) , 比 已 装 入 的 物品 的 总 价值 都 大 ,那么 当然 就 换 成 装 这 一 件 物品 . 根据 这 个 思 
想 ,设计 出 下 述 简单 的 贪心 算法 . 下 面 不 妨 设 所 有 物品 的 重量 wi; 夺 B, 否 则 可 以 把 这 件 物品 
排除 在 外 . 


贪心 算法 (G-KK) 

1. 按 单位 重量 的 价值 从 大 到 小 排列 物品 . 设 wm /ro 三 v2 /rws 三 … 三 vn /vw 

2. 顺序 检查 每 一 件 物品 ,只 要 能 装 得 下 就 将 它 装 入 背包 , 设 装 入 背包 的 总 价值 为 V. 
3. 求 内 一 max{u li 一 1,2,…,2). 若 人 二 V, 则 将 背包 内 的 物品 换 成 物品 人. 


例如 ,有 4 件 物品 : (3,7),(4,9),(2,2),(5,9), 其 中 前 一 个 数 是 重量 ,后 一 个 数 是 价 
值 ,背包 允许 的 最 大 重量 是 6. G-KK 给 出 的 解 是 装 入 (3,7) 和 (2,2), 总 价值 为 9. 若 把 第 
4 件 物品 改 为 (5,10), 则 算法 给 出 的 解 是 装 入 第 4 件 物品 (5,10), 总 价值 为 10. 这 两 个 实例 
的 最 优 解 都 是 装 入 (4,9) 和 (2,2) ,总 价值 为 11. 

定理 10.7 对 0-1 背包 问题 的 任何 实例 I, 有 

OPT(T) < 2G-KK(D 

证 设 物 品 / 是 第 1 件 未 装 入 背包 的 物品 ,由 于 物品 按 单位 重量 的 价值 从 大 到 小 排列 ， 

故 有 
OPT(T) < G-KK(D+wv <G-KK(OD + vr < 2G-KK(D) 

其 中 vwx 二 max{vi|i= 二 1,2,…,n) ,显然 vmx 三 G-KK(7T). 

定理 表明 G-KK 是 一 个 2- 近 似 算法 . 不 难 给 出 这 个 近似 比 的 紧 实 例 . 


10.4.2 多 项 式 时 间 近 仅 方 案 
把 贪心 算法 G-KK 嵌入 一 个 较 复杂 的 过 程 可 以 得 到 近似 比 任意 接近 1 的 近似 算法 . 


算法 PTAS 

输入 s 盖 0 和 实例 工 

1. 令 mm=[1/e1l 

2. 按 单位 重量 的 价值 从 大 到 小 排列 物品 . 设 mm /wan 宇 ve /twos 三 … 宇 vw/two,. 


摹 法 脸 计 与 分 新 (入 2 版 ) 


3. 对 每 一 个 :二 1,2,…,m 和 件 物品 ,检查 这 : 件 物品 的 重量 之 和 , 若 它们 的 重量 之 和 不 超过 B, 则 
接着 用 G 一 KK 把 剩余 的 物品 装 人 背包 . 

4. 比较 得 到 的 所 有 装 法 , 取 其 中 价值 最 大 的 作为 近似 解 . 

PTAS 是 一 簇 算法 . 对 每 一 个 固定 的 。>0,PTAS 是 一 个 算法 , 记 作 PTAS.. 

定理 10.8 ”对 每 一 个 es>0 和 0-1 背包 问题 的 实例 T， 

OPT(D = (1 十 e)PTAS.(D) 
且 PTSA, 的 时 间 复 杂 度 为 O(n ). 

在 证 明之 前 , 先 看 一 下 这 个 定理 的 结果 . 首先 ,对 每 一 个 固定 的 e 二 0, 算 法 PTAS. 是 多 
项 式 时 间 的 . 其 次 ,由 于 se>0 可 以 任意 的 小 ,算法 PTAS, 的 近似 比 1 二 s 可 以 任意 的 接近 1. 
从 而 ,0-1 背包 问题 是 完全 可 近似 的 . 当然 ,算法 PTSA, 的 近似 比 接近 1 的 代价 是 时 间 复 杂 
度 中 半 的 次 宕 非常 高 

证 ” 设 最 优 解 为 S* .车 |S* | 三 m, 则 算法 必得 到 S" .不 妨 设 | S” | 二 m. 考虑 计算 中 
以 S* 中 以 件 价值 最 大 的 物品 为 基础 ,用 G-KK 得 到 的 结果 S. 不 妨 设 S 取 5S" ,物品 /是 S* 
中 第 一 件 不 在 S 中 的 物品 ,在 此 之 前 G-KK 装 入 的 不 属于 S* 的 物品 (肯定 有 这 样 的 物品 ,和 否 
则 应 该 装 入 物品 2) 的 单位 重量 的 价值 都 不 小 于 vi/wi ,当然 也 不 小 于 S* 中 所 有 没有 装 入 物 
品 的 单位 重量 的 价值 , 故 有 OPT(7) 一 vit 又 因为 S 包 括 S" 中 以 件 价 值 最 大 的 物品 ， 

[3 


它们 的 价值 都 不 小 于 w, 故 又 有 w 过 二 >)vi. 于 是 ,得 到 
i€ES 
DPI 一 Dhow < Tn 4 Fw, 
iES iES m iES 


二 (+ 去 )PTAs.(D < (1 +e)PTAS.CT) 
下 面 考虑 算法 的 时 间 复 杂 度 . 从 件 物品 中 取 t 件 (1=1,2,…,m), 所 有 可 能 取 法 的 个 
数 为 


m 硬 m 
二 + 二 下 二 中 之 mm。 <n 
ml! 


对 每 一 种 取 法 ,G-KK 的 运行 时 间 为 0(n) , 故 算法 的 时 间 复 杂 度 为 O(n”t1) 二 O(ne+?)， 

设 算法 A 以 e 二 0 和 问题 的 实例 I 作为 输入 ,如 果 对 每 一 个 固定 的 e 记 0,A 是 (1 十 e)- 近 
似 算法 , 则 称 A 是 一 个 多 项 式 时 间 近 似 方案 . 算法 PTAS 是 0-1 背包 问题 的 多 项 式 时 间 近 
似 方 案 . 


10.4.3 伪 多 项 式 时 间 算 法 与 完全 多 项 式 时 间 近 似 方 案 


由 于 nn 的 短 中 含有 1/e, 随 着 近似 比 接近 1.PTAS 的 时 间 复 杂 度 中 妈 的 次 究 迅 速 增 大 ， 
而 失去 实用 价值 . 如 果 在 时 间 复 杂 度 中 ,1/e 只 出 现在 多 项 式 的 系数 中 ,而 不 出 现在 竹中 , 那 
将 好 得 多 . 

设 算法 A 以 e 二 0 和 问题 的 实例 工作 为 输入 ,如 果 A 以 某 个 二 元 多 项 式 p(T|,1/e) 为 
时 间 复 杂 度 上 界 , 且 对 每 一 个 固定 的 s>0,A 的 近似 比 为 1 十 e; 则 称 A 是 一 个 完全 多 项 式 时 
间 近 似 方案 . 

利用 伪 多 项 式 时 间 算法 可 以 构造 0-1 背包 问题 的 完全 多 项 式 时 间 近 似 方案 ,这 个 伪 多 


近似 算法 


项 式 时 间 算 法 也 是 动态 规划 算法 ,不 过 与 3. 3 节 的 动态 规划 算法 有 点 不 同 ,这 里 采用 它 的 对 条 
偶 形 式 . 令 章 


大 是 
Gd) = min{ Dwizi| Dwr >d,zxi =0 或 1,1 <i<k} 
i=1 i=1 


0 过 kn,0 之 dD,D = 二 2》)vi 且 约定 : minG = 十 0.Gi(d) 的 含义 是 : 当 只 考虑 前 & 件 


物品 时 ,为 了 得 到 不 小 于 d 的 价值 ,至 少 要 装 人 重量 为 Gi(d) 的 物品 . 问题 的 最 优 值 为 
OPT(D = max{d | G,(d) < B} 
考虑 Ge 与 Gk 的 关系 . 当 d 三 vet1 时 ,为 了 得 到 价值 4, 可 以 装 前 k& 件 物品 ,也 可 以 只 装 
第 k 十 1 件 , 取 其 重量 小 的 ,从 而 Ge (4d)= 二 min{Gi(d) ,wri). 当 d 这 vi 时 ,可 以 只 装 前 
上 件 物品 ,也 可 以 装 入 第 十 1 件 和 前 & 件 中 的 若干 件 . 只 装 前 A 件 物品 需要 装 和 人 的 最 小 重 
量 为 Gi(d), 装 入 第 & 十 1 件 和 前 & 件 中 的 若干 件 需 要 的 最 小 重量 为 Gi(d 一 v41) 十 wr, 从 
而 Go (qd) 二 min{Gi(d) ,Gi(d 一 ver) 十 wet). 于 是 ,有 下 述 递 推 公式 


0， 若 Z 一 0 
Go(d) = 
" 和 车 4 二 0 
min {Gi(d) ,waH}, 若 d < vn 
GH(d) = m by 
min {Gi(d) Gi(d—v) 二 wa}， 若 d 这 vu 


0<kn 一 1,0<dD. 和 3. 3 节 一 样 ,这 个 递 推 公式 同样 可 以 给 出 0-1 背包 问题 的 动态 规 
划 最 优化 算法 ,其 时 间 复 杂 度 为 O(zD) 王 OOzzuns) ,其 中 ws 一 maxftuli 一 1.2,…,7) .把 
这 个 算法 记 作 A. 

算法 A 也 是 伪 多 项 式 时 间 算 法 ,如 果 所 有 物品 的 价值 都 不 大 , 则 算法 可 以 变 成 多 项 式 
时 间 的 . 当 物品 的 价值 很 大 时 .D 很 大 ,为 了 节省 时 间 ,我 们 不 检查 0 一 DD 之 间 的 每 一 个 值 ， 
而 是 把 0~~DD 分 成 若干 段 , 每 一 段 长 度 为 b. 忽略 每 一 段 中 的 差别 ,每 一 段 中 只 检查 一 个 代 
表 . 如 果 4 足够 大 ,就 不 会 需要 太 多 的 时 间 . 当然 ,这 样 一 来 最 后 得 到 的 不 一 定 是 最 优 解 ,而 
只 是 一 个 近似 解 .也 就 是 说 ,用 损失 一 定 的 精度 来 换取 大 量 的 时 间 . 但 /又 不 能 太 大 ,和 否则 不 
可 能 得 到 足够 好 的 近似 解 , 因 此 需要 取 到 合适 的 5b 值 才 行 . 

算法 FPTAS 

输入 e>0 和 实例 工 


局 J 

1 Somax(L os/ (++) 1). 

2. 令 坟 =[w 1<i<n. 把 实例 I 中 所 有 物品 的 价值 v; 换 成 v, 记 新 得 到 的 实例 为 ". 
3. 对 了 应 用 算法 A 得 到 解 5, 把 S 取 作 实例 了 的 解 . 


定理 10.9 对 每 一 个 s>0 和 0-1 背包 问题 的 实例 T， 
OPT(D < (1 二 e)FPTSACD 
并 且 FPTAS 的 时 间 复 杂 度 为 ol 站 
证 ”着 慎 ( 一 区 ET 二 对 任意 的 GE 人 oa， 
0<6P)v— Dv <6I Ton 


iET iET 


人 滤 法 谈 计 与 分 帮 ( 血 2 版 ) 


工 的 最 优 解 为 S” .注意 到 S 是 1 的 最 优 解 , 故 有 


OPT(DI) — FPTAS(D= > 一 > u 


iES” ies 
= (Zu-627v)+(e 2 v5220) 二 (52 全 5») 
iES” iES™ i€ES” i€S iES iES 
< (io 全 22v:) = bn 
i€S iES 


其 中 第 2 个 等 号 右边 的 前 两 项 都 小 于 等 于 0. 


对 每 一 个 e>0, 若 0 一 1, 则 了 就 是 TI.S 是 了 的 最 优 解 ,从 而 FPTAS(7T) 二 OPT(D. 下 面 


设 5 二 1, 注 意 到 ws 委 OPT(T) ,得 


整理 得 到 


OPT(D — FPTAS(D < wj (1 十 过] 和 opT.D/ (1 + 二 


OPTOD ROLL 十 的 FETASCGN 


算法 的 运行 时 间 主 要 花 在 是 A 对 了 的 运算 ,其 时 间 复 杂 度 为 O(n?vmx/0) 一 


oe) 


10.2 


10. 4 


10.5 


定理 表明 算法 FPTAS 是 0-1 背包 问题 的 完全 多 项 式 时 间 近 似 方案 . 


习 题 10 


10. 1 节 中 最 小 顶点 覆盖 问题 的 近似 算法 MVC 任 取 一 条 边 , 把 这 条 边 的 两 个 端点 加 
和 项 点 覆盖 集 ,现在 改 为 只 把 这 条 边 的 一 个 端点 加 入 顶点 覆盖 集 ,其余 不 变 . 试 分 析 
这 个 修改 后 的 算法 的 近似 性 能 . 


给 出 “对 货 郎 问题 所 有 满足 三 角 不 等 式 的 实例 1, MM( 了 DD 二 六 OPTCID”( 定 理 10. 5) 


的 紧 实 例 . 
装 箱 问题 (优化 形式 ) : 任 给 件 物品 ,物品 j 的 重量 为 wj ,1<j<n. 限制 每 只 箱子 装 
入 物品 的 总 重量 不 超过 B, 这 里 w; 和 B 都 是 正 整数 . 且 wj 三 B,1 二 j 二 nn. 要 求 用 最 
少 的 箱子 装 人 所 有 的 物品 ,怎么 装 法 ? 
考虑 下 述 简单 的 装 法 . 
首次 适合 算法 (FF) : 按照 输入 顺序 装 物品 ,对 每 一 件 物品 ,依次 检查 每 一 只 箱子 ,只 
要 能 装 得 下 就 把 它 装 人. 只 有 在 所 有 已 经 打开 的 箱子 都 装 不 下 这 件 物品 时 , 才 新 打 
开 一 只 箱子 . 
证 明 : 对 装 箱 问 题 的 所 有 实例 工 ， 

EP < 20P Th 


证 明 : 装 箱 问题 不 存在 近似 比 /二 总 的 多 项 式 时 间 近 似 算法 ,除非 P=NP. 


设 无 向 图 G==<<V ,E>,ViUVs,=V,Vi 人 Vs=@, 称 (Vi ,Va)={(us0)| (uv) EE, 
且 uEVi,vEVs) 是 G 的 割 集 . (Vi ,Vi) 中 的 边 称 作 割 边 ,不 在 (Vi ,Vs) 中 的 边 称 作 非 


近似 算法 


i 10 
求 最 大 割 集 问 题 : 任 给 无 向 图 G 王 <V,E>, 求 G 的 边 数 最 多 的 割 集 . 


考虑 下 述 求 最 大 割 集 问题 的 局 部 改进 算法 . 
算法 MCUT: 令 Vi 二 V ,Vs 一 人 @. 如 果 存 在 顶点 ,在 关联 的 边 中 非 制 边 多 于 制 边 ， 
如 果 xEVw , 则 把 x 移 到 V: 中 ;如 果 w€EV;, 则 把 w 移 到 Vi 中 .直到 不 存在 这 样 的 顶 
点 为 止 , 取 此 时 得 到 的 (Vi ,V: ) 作 为 解 . 
证 明 : 对 最 大 割 集 问题 的 每 一 个 实例 了 I， 

OPT(D < 2MCUT(D) 
双 机 调度 问题 (优化 形式 ): 有 2 台 相 同 的 机 器 入 项 作业 J 卫 ,J。,…,J, ,每 一 项 作业 
可 以 在 任 一 台 机 器 上 处 理 , 没 有 顺序 限制 ,作业 J; 的 处 理 时 间 为 正 整 数 1;,1<i<n. 
要 求 把 项 作业 分 配给 这 2 台 机 器 使 得 完成 时 间 最 短 , 即 把 {1,2,…,n) 划 分 成 和 
1 ,使 得 


max{ Di, 2 6} 


iT iElI, 


最 小 . 
令 D= [32s = {= De< ep B() 包 括 


所 有 前 i 项 作业 中 任意 项 (可 以 是 0 项) 作业 的 处 理 时 间 之 和 ,只 要 这 个 和 不 超过 所 
有 作业 处 理 时 间 之 和 的 1/2. 

试 给 出 关于 B07) 的 递 推 公式 ,并 利用 这 个 递 推 公式 设计 双 机 调度 问题 的 伪 多 项 式 时 
间 算法 ,进而 设计 这 个 问题 的 完全 多 项 式 时 间 近 似 方案 . 


第 章 
i | 随机 算法 


在 算法 中 加 入 随机 性 ,这 并 不 是 十 分 新 鲜 的 想法 ,人 们 早 就 在 其 他 场合 这 样 做 了 . 例如 ， 
做 民意 调查 的 时 候 ,需要 随机 选择 访问 的 对 象 . 又 如 ,对 股票 市 场 这 类 本 身 不 确定 的 系统 进 
行 仿真 时 ,随机 化 也 是 自然 的 工具 ,这 就 是 所 谓 的 蒙特 卡 洛 方法 . 对 于 很 多 问题 来 说 ,采用 随 
机 算法 比 采 用 确定 型 算法 效率 更 高 ,算法 也 更 简单 . 例如 ,对 于 素数 检验 问题 来 说 ,解决 这 个 
问题 的 随机 算法 不 仅 是 计算 机 科学 中 最 早 提出 的 随机 算法 之 一 :而且 到 目前 为 止 ,仍然 比 这 
个 问题 的 确定 型 算法 的 速度 更 快 . 

一 般 来 说 ,虽然 随机 算法 描述 起 来 并 不 复杂 .但 是 随机 算法 分 析 起 来 往往 并 不 简单 . 在 
本 章 我 们 将 学 习 一 些 最 基本 的 随机 算法 的 设计 与 分 析 方 法 . 我 们 先 给 出 概率 论 的 一 些 预备 
知识 ,包括 在 随机 算法 分 析 中 常用 的 二 项 式 系数 的 估计 、 期 望 的 线性 性 质 .并 的 界 .马尔 科 夫 
不 等 式 . 切 比 雪夫 不 等 式 、 切 诺 夫 界 等 。 然 后 以 快速 排序 为 例 , 给 出 两 种 不 同 的 平均 运行 时 
间 分 析 ,说 明了 随机 算法 的 基本 分 析 方 法 . 在 此 基础 上 ,介绍 随机 算法 的 分 类 和 计算 复杂 性 
理论 的 一 些 结果 ,包括 拉 斯 维 加 斯 型 和 蒙特 卡 洛 型 这 两 类 随机 算法 ,以 及 对 随机 算法 能 力 和 
局 限 性 的 简单 讨论 . 然后 介绍 素数 检验 和 多 项 式 恒 等 检验 的 随机 算法 ,最 后 介绍 用 马 氏 链 分 
析 随 机 游 动 算法 . 


11.1 概率 论 预备 知识 


在 有 限 概 率 空 间 中 ,存在 着 有 穷 个 基本 事件 ,每 个 基本 事件 发 生 的 概率 是 L0,1] 中 的 
数 , 所 有 基本 事件 的 概率 之 和 等 于 1. 例如 ,抛掷 一 枚 均匀 硬币 ,基本 事件 包括 正面 向 上 和 反 
面向 上 ,各 自 概率 都 为 1/2. 一 些 基 本 事件 的 组 合 称 为 事件 ,事件 发 生 的 概率 等 于 其 中 基本 
事件 的 概率 之 和 . 例如 , 抛 搓 一 枚 均匀 的 六 面色 子 .基本 事件 为 得 到 1,.2,3.4,5,6 点 之 一 , 概 
率 各 为 1/6, 掷 色 子 得 到 偶数 这 一 事件 ,由 2,4,6 点 这 3 个 基本 事件 组 成 ,概率 为 1/6 十 1/6 十 
1/6 二 1/2. 通常 把 事件 A 的 概率 记 为 PrLA]. 设 A; ,A: ,…',A, 都 是 事件 ,事件 A; 的 概率 为 


PrLAi], 则 Pr [ (Ai] 三 > Pr[A,] ,这 个 不 等 式 称 为 并 的 界 . 


随机 变量 是 从 概率 空间 到 实数 的 映射 . 随机 变量 取 各 种 值 的 概率 就 是 分 布 . 例如 ,抛掷 
一 枚 均匀 硬币 n 次 ,记录 正面 向 上 的 次 数 , 就 得 到 一 个 随机 变量 X, 其 取 值 范围 是 0,1， 


2,…,n, 久 的 分 布 可 以 描述 为 PICX 一 中 一人 ?]” ,这 称 为 二 项 分 布 在 涉及 二 项 分 布 的 计 


大 机 算法 


算 中 ,常常 需 要 合计 [ 的 阶 , 党 用 的 公式 为 


7 
k 
ny n en 
3 < 人 名 ) 
随机 变量 的 加 权 平均 值 称 为 期 望 ,通常 把 随机 变量 X 的 期 望 记 作 ELX]. 例如 ,上 述 二 
项 式 分 布 随机 变量 X 的 期 望 为 ELX] = Ble 设 XX, 了 是 同一 个 概率 空间 上 的 两 个 随 


机 变量 ,可 以 定义 X 十 Y 为 一 个 新 的 随机 变量 ,X 十 Y 在 每 个 基本 事件 上 的 取 值 就 是 X 与 立 
在 这 个 基本 事件 上 的 取 值 之 和 . 对 于 常数 ,也 可 以 定义 新 的 随机 变量 aX ,其 取 值 是 原来 X 
取 值 的 a 倍 . 随机 变量 的 期 望 有 所 谓 的 线性 性 质 : 

ELaX +6bY] = ecELX] 十 ELY] 


特别 当 X = >) X, 时 ,有 
ELX] = ELX:] 


例如 , 设 X; 表示 第 ;次 抛掷 硬币 的 结果 ,1 表示 正面 向 上 ,0 表示 反面 向 上 ,ELX;] 二 1 性 十 


1 
9 


0 评 一 去 , 则 上 述 X 的 期 望 值 


ELX] = 2 ELX] = 2 玛 = 三 
对 于 取 值 非 负 的 随机 变量 X 来 说 ,一 个 有 用 的 性 质 是 PrLX 三 AELX]] 近 1 人 ,或 者 
Pr[X 宇 k] 志 E[X]/k, 这 称 为 马尔 科 夫 不 等 式 . 
在 事件 B 发 生 的 条 件 下 .事件 A 发 生 的 概率 称 为 条 件 概 率 , 记 作 Pr[A|B], 计 算 公 式 为 
Pr[A | B] = Pr[LA mn BJ/PrLB] 
车 PrLA1B]=PrLA] ,或 者 等 价 地 PrLAPB]=PrLA]PrLB], 则 说 事件 A,B 是 独立 事件 . 对 
于 随机 变量 X,Y 来 说 , 若 对 所 有 可 能 的 取 值 +,y, 事 件 {X==x)} 和 {Y= 二 y} 都 是 独立 的 , 则 说 
X,Y 是 独立 随机 变量 . 对 于 独立 随机 变量 ,有 EL[XY] 二 EL[X]E[Y]. 一 组 随机 变量 Xi， 
X: ,…,X, 称 为 完全 独立 ,如 果 对 于 任何 SS(1,2,…,z}, 有 


Pr[ 门 xX;|= TI PrLX;] 
i€S iES 
对 于 完全 独立 的 随机 变量 Xi ,X: .…,X,, 有 
E[JIx,]= IIECx 
i=1 i=1 
随机 变量 与 期 望 之 差 的 平方 加 权 平 均值 称 为 方差 . 记 作 Var[X], 计 算 公 式 为 
Var[X] = EL[(X— ELzx])*] = ELX*:] — (ELX])? 
注意 ,总 是 有 EL[LX?] 宇 (ELX])? ,这 称 为 雇 森 不 等 式 . 方差 的 平方 根 叫 做 标准 差 , 记 作 
0;, 即 oc 二 VVarLX]. 如 果 随 机 变量 Xi ,X* .…:.X, 是 两 两 独立 的 , 则 


Var[ > X:| 一 Dl var[x] 


出 二 四 
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若 随机 变量 X 的 方差 为 2 , 则 对 于 任意 4A>0. 有 
Pr[| X 一 ELX] |> ko <1/k 
这 称 为 切 比 雪夫 不 等 式 . 
如 果 随 机 变量 Xi ,Xz: ,…,X, 是 完全 独立 的 ,并 且 每 个 Xi 取 值 在 {0,1} 中 , 设 w 一 


ELX] , 则 对 于 任何 8 二 0, 有 


2 


更 
Pr[ OX +n]< [46]| 


p 


n 一 
Pr [ZX<a-Hx]< [| 
以 及 对 任何 c 二 0, 有 
Pr[ | Si —4|> 4%]< 2 » exp(— min{c’/4,c/2}p) 
i=1 
其 中 exp(x) 二 =e. 这 3 个 不 等 式 统称 为 切 诺 夫 界 . 


11.2 对 随机 快速 排序 算法 的 分 析 


本 节 以 随机 快速 排序 算法 为 例 ,给 出 了 平均 运行 时 间 的 两 种 不 同 的 分 析 , 说 明 分 析 随 机 
算法 的 基本 方法 . 第 一 种 分 析 方 法 利用 平均 运行 时 间 的 递 推 关 系 式 ,第 二 种 分 析 方 法 利用 期 
望 的 线性 性 质 ,这 两 种 方法 都 是 分 析 随 机 算法 的 常用 基本 方法 . 


算法 11.1 随机 快速 排序 算法 

输入 : 包含 nn 个 元 素 的 数组 

输出 : 经 过 排序 的 个 元 素 的 数组 

1. 若 数组 包含 0 或 1 个 元 素 则 返回 . 

2. 从 数组 中 随机 选择 一 个 元 素 作 为 枢 轴 元 素 . 

3. 把 数组 元 素 分 为 3 个 子 数组 ,并 且 按 照 A.B,C 顺序 排列 : 
A: 包含 比 枢 轴 元 素 小 的 元 素 ; 
B: 包含 与 枢 轴 元 素 相等 的 元 素 ; 
C: 包含 比 枢 轴 元 素 大 的 元 素 . 

4. 对 A 和 C 递归 地 执行 上 述 步骤 . 


定理 11.1 设 数组 含 n 个 不 同 元 素 . 随 机 快速 排序 算法 的 期 望 比较 次 数 T(n) 夺 2nlnn. 
证 一 选 定 枢 轴 元 素 后 ,其 余 一 1 个 元 素 每 个 都 要 与 枢 轴 元 素 比 较 一 次 ,以 决定 在 子 
数组 A,B,C 中 的 归属 ,根据 枢 轴 元 素 的 大 小 ,A 和 C 中 的 元 素 个 数 分 别 可 能 是 0 和 一 1,1 
和 nn 一 2,…,n 一 1 和 0, 分 别 对 应 于 枢 轴 元 素 在 排序 后 的 数组 中 位 于 第 1,2,…,n 个 位 置 上 。 
由 于 枢 轴 元 素 是 随机 选取 的 . 枢 轴 元 素 在 排序 后 的 数组 中 位 于 第 1,2,….n 个 位 置 上 的 概率 


都 是 1/n, 所 以 有 递 推 式 T(n) = (n 一 1) 十 二 [TCD 十 T(n 一 i 一 1)J. 在 例 1.14 已 经 得 


到 这 个 递 推 式 的 解 是 (nlogn) .可 用 数学 归纳 法 证 明 这 个 递 推 式 更 精确 的 上 界 , 即 T(n) 三 
2nlnn. 详细 步骤 如 下 : 
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Wi) 版 
入 一 可 十 二 > Cilod) En = 十 和 | C2ilni) 
i=1 1 


去 (2 一 1T 十 rlnn 一 12/2 十 1/2) < 2nlnn 
证 二 首先 定义 随机 变量 X; : 
1 若 算 法 比较 第 i 小 元 素 和 第 j 小 元 素 


X; = 
0 否则 


其 中 第 ;小 和 第 ;小 指 的 是 ,在 经 过 排序 以 后 的 数组 中 的 位 置 . 于 是 算法 的 总 共 比较 次 数 为 
yx ,根据 数学 期 望 的 线性 性 质 , 算 法 的 期 望 运行 时 间 为 


i=1j= 计 1 
T(n) = 可 号 3 3 x]= 3 BELx,] 
由 于 Xj 的 取 值 为 0 或 1, 所 以 
ELXy] = 1° Pr[LX; = 1]+0° PrLX; = 0] = Pr[LX; = 1] 
下 面 我 们 就 来 计算 X; 的 概率 分 布 . 

如 果 在 经 过 排序 以 后 的 数组 中 , 枢 轴 元 素 位 于 第 i 小 和 第 j 小 元 素 之 间 , 则 在 算法 执行 
过 程 中 ,第 i 小 和 第 j 小 元 素 在 与 枢 轴 元 素 比 较 之 后 ,就 被 分 配 到 不 同 的 子 数组 A 和 C 中 ， 
因此 以 后 再 也 不 会 比较 这 两 个 元 素 ,此 时 X; ==0. 如 果 枢 轴 元 素 恰 好 就 是 第 i 小 或 第 j 小 元 
素 之 一 , 则 这 两 个 元 素 之 间 要 进行 比较 ,此 时 X; 一 1. 如 果 枢 轴 元 素 同时 比 第 i 小 和 第 j 小 
元 素 都 大 或 都 小 , 则 这 两 个 元 素 被 分 在 同一 个 子 数组 A 或 C 之 中 ,它们 之 间 是 否 进行 比较 ， 
则 要 取决 于 下 一 次 选取 的 枢 轴 元 素 . 

每 次 选取 枢 轴 元 素 时 ,只 要 枢 轴 元 素 位 于 第 i 小 和 第 j 小 元 素 之 间 , 这 两 个 元 素 就 肯定 不 
会 进行 比较 . 如 果 枢 轴 元 素 位 于 第 i 小 和 第 j 小 元 素 之 外 , 则 还 要 根据 以 后 选取 的 枢 轴 元 素来 
判断 这 两 个 元 素 是 否 进行 比较 .只 有 当 枢 轴 元 素 恰好 就 是 第 i 小 或 第 j 小 元 素 之 一 时 ,这 两 个 
元 素 之 间 才 进行 比较 . 因此 相当 于 在 排 好 序 的 数组 上 进行 这 样 的 投标 游戏 : 如 果 把 标 投 在 第 i 
小 和 第 j 小 元 素 之 外 , 则 继续 投标 ;如 果 把 标 投 在 第 i 小 和 第 j 小 元 素 之 间 ,或 投 在 这 两 个 元 素 
之 上 , 则 游戏 结束 . 游戏 结束 时 X 二 1 当 且 仅 当 把 标 投 在 第 i 小 和 第 j 小 元 素 之 上 。 因 此 

PrLX; 二 1j== Pr[ 在 第 i 小 和 第 j East 把 标 投 在 这 两 个 元 素 上 ] 


”在 第 7 小 和 第 j 不 元 素 之 同 (这 两 个 元 素 ) 的 元 素 个 数 
_ 效 
7 一 ;十 1 


ml 玫 
TCD 一 E(Z ZX )= pa BCR = Dp 
1 
Dal(s We i 


。 t 村 2n(H, — 1) = 2nlnn 


击 二 恰 
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其 中 调和 级 数 友 一 1 十 二 十 二 十 … 满 足 Inn 二 H, 二 1 十 lnn, 这 与 前 面 的 结果 一 样 . 


在 这 里 请 读者 注意 ,随机 算法 的 期 望 运行 时 间 与 确定 型 算法 在 平均 情况 下 的 运行 时 间 
二 者 的 区 别 . 在 随机 算法 中 ,在 给 定 的 一 个 输入 上 ,随机 算法 的 运行 时 间 是 随机 变量 ,这 个 
随机 变量 的 期 望 值 就 是 随机 算法 在 给 定 输入 上 的 期 望 运 行 时 间 . 而 在 平均 情况 分 析 中 , 假 
设 在 所 有 的 输入 上 有 一 个 概率 分 布 ,算法 在 不 同 输入 上 的 运行 时 间 是 随机 变量 ,这 个 随机 变 
量 的 期 望 值 就 是 算法 的 平均 运行 时 间 ,在 本 书 第 12 章 的 12. 5 节 有 平均 情况 分 析 的 一 个 例 
子 . 在 随机 算法 中 ,给 定 一 个 输入 和 一 个 随机 选择 序列 之 后 ,算法 的 执行 就 是 确定 的 ,因此 
一 个 随机 算法 就 等 价 于 一 族 确定 型 算法 以 及 在 这 族 确定 型 算法 上 的 一 个 概率 分 布 . 所 以 ， 
随机 算法 给 定 一 个 输入 ,概率 分 布 定义 在 算法 上 ;而 平均 情况 分 析 中 给 定 一 个 算法 ,概率 分 
布 定义 在 输入 上 ,这 是 二 者 的 主要 区 别 . 但 是 这 两 者 之 间 又 是 有 关联 的 ,例如 著名 的 姚 的 极 
小 - 极 大 引 理 (简称 姚 引 理 ) 说 明 , 可 以 通过 平均 情况 分 析 给 出 随机 算法 运行 时 间 的 下 界 , 请 
读者 参考 文献 [17]. 


11.3 随机 算法 的 分 类 及 其 局 限 性 


本 节 介 绍 随机 算法 的 分 类 ,包括 拉 斯 维 加 斯 型 和 蒙特 卡 洛 型 这 两 大 类 ,并 且 从 计算 复杂 
度 理论 的 角度 ,介绍 NP 完全 问题 不 太 可 能 有 多 项 式 时 间 随 机 算法 的 结论 . 


11.3.1 拉 斯 维 加 斯 型 随机 算法 


11. 2 节 介 绍 的 随机 快速 排序 算法 是 拉 斯 维 加 斯 型 随机 算法 ,这 种 算法 总 是 给 出 正确 的 
结果 ,但 有 时 运行 时 间 长 些 . 有 时 运行 时 间 短 些 . 对 于 拉 斯 维 加 斯 型 算法 ,通常 需要 分 析 算 法 
的 平均 运行 时 间 . 例如 ,随机 快速 排序 算法 总 是 给 出 已 经 排序 的 数组 ,期望 的 运行 时 间 则 是 
2nlnn. 拉 斯 维 加 斯 型 随机 算法 的 运行 时 间 本 身 是 一 个 随机 变量 ,把 期 望 运行 时 间 是 输入 规 
模 的 多 项 式 且 总 是 给 出 正确 答案 的 随机 算法 称 为 有 效 的 拉 斯 维 加 斯 型 算法 . 随机 快速 排序 
算法 就 是 一 个 有 效 的 拉 斯 维 加 斯 型 算法 . 


11.3.2 党 将 卡 洛 型 随机 算法 


除了 11. 3. 1 节 介 绍 的 拉 斯 维 加 斯 型 随机 算法 外 ,还 有 男 一 种 类 型 的 随机 算法 ,就 是 蒙 
特 卡 洛 型 随机 算法 . 这 种 算法 有 时 会 给 出 错误 的 答案 ,后 面 两 节 将 要 介绍 的 素数 检验 、 多 项 
式 恒 等 检验 的 随机 算法 和 布尔 可 满足 性 问题 的 随机 游 动 算法 都 是 这 类 算法 的 例子 . 对 于 蒙 
特 卡 洛 型 算法 ,通常 需要 分 析 算 法 的 出 错 概率 . 蒙特 卡 洛 型 算法 不 但 运行 时 间 是 随机 变量 ， 
而 且 计 算 的 结果 也 是 随机 事件 . 把 总 是 在 多 项 式 时 间 内 运行 且 出 错 概率 不 超过 1/3 的 随机 
算法 称 为 有 效 的 蒙特 卡 洛 型 算法 . 这 里 的 出 错 概率 1/3 可 以 变 得 任意 小 ,只 要 让 算法 执行 足 
够 多 次 ,从 所 有 单 次 结果 中 选择 出 现 次 数 最 多 的 结果 作为 总 的 结果 即 可 . 1/3 这 个 值 本 身 也 
不 重要 ,只 需要 独立 重复 执行 多 次 ,就 可 以 把 错误 概率 降 到 1/3 以 下 ,甚至 降低 到 输入 规模 
的 多 项 式 倒数 或 者 更 低 . 

蒙特 卡 洛 型 算法 又 可 分 为 单 侧 错误 和 双 侧 错误 两 类 , 单 侧 错 误 又 可 分 为 弃 真 型 和 取 伪 型 
这 两 种 . 所 谓 弃 真 型 错误 ,就 是 在 求解 一 个 判定 问题 时 把 本 应 接受 的 输入 误 判 为 拒绝 . 对 于 弃 
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真 型 的 单 侧 错误 随机 算法 来 说 , 当 算 法 宣布 接受 时 ,结果 一 定 是 对 的 ;而 当 算 法 宣布 拒绝 时 , 结 
果 有 可 能 是 错 的 . 所 谓 取 伪 型 错误 ,就 是 把 本 应 拒绝 的 输入 误 判 为 接受 . 对 于 取 伪 型 的 单 侧 错 
误 随 机 算法 来 说 , 当 算 法 宣布 拒绝 时 ,结果 一 定 是 对 的 ;而 当 算法 宣布 接受 时 ,结果 有 可 能 是 错 
的 . 单 侧 错误 的 蒙特 卡 洛 型 算法 在 所 有 输入 上 ,要 么 只 犯 弃 真 的 错误 ,要 么 只 犯 取 伪 的 错误 ,不 
同时 出 现 这 两 种 不 同 的 错误 . 双 侧 错误 的 蒙特 卡 洛 型 算法 在 所 有 输入 上 ,可 以 同时 出 现 这 两 种 
不 同 的 错误 . 后 面 将 要 介绍 的 随机 游 动 算法 就 是 弃 真 型 的 单 侧 错 误 的 蒙特 卡 洛 型 随机 算法 。 


11.3.3 随机 算法 的 局 限 性 


在 计算 复杂 性 理论 中 ,有 效 的 拉 斯 维 加 斯 型 算法 也 称 为 ZPP 类 (zero-error probabilistic 
polynomial time) 算 法 , 即 零 错 误 概率 多 项 式 时 间 随 机 算法 . 有 效 的 蒙特 卡 洛 型 算法 也 被 为 
BPP 类 (bounded-error probabilistic polynomial time) 算法 , 即 错误 概率 有 界 的 多 项 式 时 间 
随机 算法 ,其 中 有 效 的 弃 真 型 单 侧 错误 随机 算法 又 称 为 RP 类 算法 ,有 效 的 取 伪 型 单 侧 错误 
随机 算法 则 称 为 coRP 类 算法 . 把 ZPP 类 算法 可 以 求解 的 判定 问题 类 记 作 ZPP 类 ,类 似 地 
可 以 定义 BPP、RP、coRP 等 判定 问题 类 . 有 效 的 拉 斯 维 加 斯 型 算法 是 有 效 的 蒙特 卡 洛 型 算 
法 的 特殊 情况 ,可 以 证 明 上 述 复杂 性 类 满足 

PSEZPP=RPPcoRPSEBPPEP/poly 
这 里 的 P/poly 表示 多 项 式 规模 的 电路 能 够 求解 的 布尔 函数 类 ,上 述 所 有 复杂 性 类 都 是 它 的 子 类 . 
在 计算 复杂 性 理论 中 有 卡 普 - 利 普 顿 (Karp-Lipton) 定 理 : 若 NPS P/poly, 则 PH = 


DD . 其 中 PH(polynomial-time hierarchy 球 示 复 杂 性 类 从 低 到 高 的 层次 结构 ,也 叫做 多 项 


式 谱系 . 沪 指 这 个 谱系 中 的 第 2 层 . 根据 这 个 定理 ,如 果 NP 完全 问题 具有 有 效 的 随机 算 
法 , 即 NP 完全 问题 属于 BPP 类 , 则 NP SS P/poly, 于 是 多 项 式 谱系 中 上 面 各 层 将 会 “塌方 ” 
到 第 2 层 3》 因此 ,假设 多 项 式 谱系 不 塌方 ,即使 采用 随机 算法 ,也 无 法 有 效 地 解决 NP 完 
全 问题 . 事实 上 ,基于 一 定 的 计算 复杂 性 理论 的 假设 ,通过 去 随机 化 (de-randomize) 技 术 , 甚 
至 可 以 证 明 P 一 BPP( 注 意 这 个 结论 是 有 条 件 的 , 即 在 一 定 的 计算 复杂 性 理论 假设 下 ). 

这 些 结果 清楚 地 表明 了 随机 算法 在 能 力 上 的 限制 , 即 不 太 可 能 为 NP 完全 问题 设计 出 
多 项 式 时 间 的 随机 算法 . 虽然 如 此 ,对 于 各 种 问题 ,随机 算法 依然 可 能 比 最 好 的 确定 型 算法 


更 快 . 11. 4. 1 节 中 我 们 将 给 出 这 样 的 例子 : 素数 检验 问题 ,这 个 问题 的 随机 算法 比 已 知 的 
确定 算法 更 快 . 


11.4 素数 检验 和 多 项 式 恒 等 检验 


本 节 首 先 介绍 素数 检验 问题 的 单 侧 错误 概率 的 coRP 型 随机 算法 ,然后 介绍 多 项 式 恒 
等 检验 的 随机 算法 . 略 去 一 些 数论 结果 的 证 明 ,读者 可 参阅 有 关 的 初等 数论 书籍 ,例如 华 罗 
庚 著 《数论 导 引 》 科 学 出 版 社 ,1979). 


11.4.1 素数 检验 
素数 判定 问题 的 随机 算法 是 计算 机 科学 中 最 早 提出 的 随机 算法 之 一 . 这 个 算法 突出 表现 
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了 随机 算法 的 优点 : 简单 和 有 效 .为 了 介绍 这 个 算法 .要 先 定义 一 些 数论 中 的 概念 和 记号 . 
我 们 把 a 与 5 的 最 大 公 因 数 记 为 gcd(a.6), 可 用 著名 的 轧 转 相 除 法 求 得 . 如 果 存 在 b， 
使 得 a 二 所 (modn) 并 且 gcd(65,n) 二 1, 则 说 a 是 模 n 的 二 次 剩余 . 对 于 1 三 a 三 nn, 定义 


0 gcd(Ca,z) 一 1 
QR,(a) = 1 十 1 a 是 模 n 的 二 次 剩余 
一 1 否则 


由 初等 数论 可 知 ,对 于 每 个 奇 素数 n 和 所 有 1 二 a 三 n 一 1, 都 有 QR, (a)= 二 =a”?/?(modn). 


大 
对 于 奇数 和 a , 设 n 的 全 部 素数 因子 为 p1,…,pi, 即 二 I ps ,定义 雅 各 比 符号 为 
(#)= I QR 0) 


雅 各 比 符号 可 在 O(loga， logn) 时 间 内 求 得 . 由 初等 数论 可 知 ,对 于 每 个 奇数 nn 和 所 有 满足 
gcd(n,a) 二 1 的 1 二 a 三 n 一 1, 至 多 有 一 半 的 a 满足 各]=a”?2Cmodn) ,下面 这 个 算法 就 
利用 这 个 等 式 来 检验 素数 . 


算法 11.2 素数 检验 算法 

输入 : 自然 数 n. 

输出 : ) 是 否 素 数 . 

1. 若 n 是 偶数 且 n 取 2, 则 宣布 "n 是 合 数 " ,结束 计算 ; 

2. 若 "一 2, 则 宣布 "” 是 素数 " ,结束 计算 ; 

3. 若 "一 1, 则 宣布 "一 1" ,结束 计算 ; 

4. 从 {1,…,n 一 1} 中 随机 选择 自然 数 a; 

5. 若 gcd(nsa) 二 1 或 (各) 了 a modm) , 则 宣布 " 是 合 数 "; 

6. 否则 ,宣布 "n 是 素数 ". 

定理 11.2 素数 检验 算法 在 多 项 式 时 间 内 运行 . 当 n 是 素数 时 ,素数 检验 算法 总 是 输 
出 正确 结果 ; 当 不 是 素数 时 ,素数 检验 算法 至 少 以 概率 1/2 输出 正确 结果 . 

证 ”由 于 最 大 公 因 数 和 雅 各 比 符 号 都 是 多 项 式 时 间 可 计算 的 ,而 利用 反复 平方 法 , 求 宕 
也 是 多 项 式 时 间 可 计算 的 ,显然 素数 检验 算法 在 多 项 式 时 间 内 运行 . 
如 前 所 述 , 由 初等 数论 中 的 结论 可 知 ,对 于 每 个 奇 素数 nn 和 所 有 1 三 a 三 n 一 1, 都 有 
QR, (a) 二 a"” ?2(modn); 对 于 每 个 奇 合 数 nn 和 所 有 满足 gcd(n.a) 二 1 的 1 二 a 三 n 一 1, 至 多 


有 一 半 的 a 满足 [各]=a"?4Cmodm). 因此, 当 是 素数 时 ,算法 总 是 正确 检验 出 “是 素 


数 ”; 而 当 n 是 合 数 时 ,算法 至 少 以 1/2 概率 检验 出 “n 是 合 数 ”. 
当 n 是 素数 时 ,算法 总 是 正确 判定 是 素数 ,因此 没有 弃 真 型 错误 ,所 以 这 是 个 coRP 
型 随机 算法 . 通过 多 次 重复 执行 这 个 算法 ,就 可 以 降低 错误 概率 到 任意 小 的 程度 . 


11.4.2 多 项 式 恒 等 检验 


11.4.1 节 介 绍 的 素数 检验 问题 现在 已 经 有 多 项 式 时 间 确 定 算法 ,虽然 确定 算法 在 效率 
上 不 如 随机 算法 . 这 一 节 介绍 多 项 式 恒 等 检 验 问题 的 有 效 随 机 算法 ,这 个 问题 到 目前 为 止 还 


大 机 算法 


没有 有 效 的 确定 算法 . 多 项 式 恒 等 检 验 就 是 给 定 两 个 多 元 多 项 式 , 要 检验 这 两 个 多 项 式 是 否 
恒 等 的 问题 . 我 们 假设 多 项 式 是 用 紧凑 形式 来 表示 的 ,而 不 一 定 用 展开 成 单项 式 之 和 的 形 
式 .确切 地 说 ,假设 用 代数 电路 来 表示 多 项 式 ,电路 的 结构 是 一 个 有 向 无 圈 图 .有 一 些 顶 点 人 
度 为 零 .可 以 作为 输入 顶点 ,每 个 输入 可 以 是 变量 或 常数 ;有 一 些 顶 点 出 度 为 零 , 可 以 作为 输 
出 顶点 .除了 输入 以 外 的 每 个 顶点 都 叫做 一 个 门 ,每 个 门 可 以 进行 加 法 、 减 法、 乘法 运算 . 每 个 
这 样 的 电路 都 以 自然 的 方式 表示 一 个 多 项 式 , 门 的 个 数 叫做 电路 的 规模 . 例如 , (1 十 zx) (y 十 z) 
的 规模 是 3, 即 2 次 加 法 和 1 次 乘法 ;(((Cz 十 y)2)2)2 的 规模 为 4, 即 1 次 加 法 和 3 次 乘法 . 假 
设 每 个 门 的 扇 人 为 2, 即 所 有 门 都 表示 二 元 运算 ,有 且 仅 有 2 个 输入 ,所 以 xz 十 y 十 = 的 规模 
为 2, 即 2 次 二 元 加 法 ,而 不 是 1 次 三 元 加 法 . 设 p(Czi,… ,x,) 和 g(xz1，… ,zx,) 是 两 个 多 项 式 ， 
令 r(x Tn) =p(ris" Tn)— g(r ，,…… ,Xs) ,于 是 检验 blrys"" sk ) 和 q(x1 ，" ,Xn) 是 否 
恒 等 的 问题 ,就 等 价 于 检验 r(x,… ,zx,) 是 否 恒 等 于 零 的 问题 . 

算法 11.3 多 项 式 恒 等 检 验算 法 

输入 : 用 规模 为 m 的 代数 电路 C(zi，…,z,) 表 示 的 多 项 式 r(x ，… ,zx,). 

输出 : r(zi,…，vzw) 是 否 便 等 于 0. 

1. 从 {1,…,10。2"} 中 随机 选择 于 个 自然 数 ai ,… ,av( 可 重复 ); 

2. 从 {1,…，,22} 中 随机 选择 自然 数 As 

3. 在 模 人 算术 下 ,计算 > 一 C(el ,…,aw) (modA) 一 r(al,… an) (modk); 

4 


. 车 y 二 0, 则 输出 "rCr,… ,zn) 便 等 于 0"; 
5， 否则 ,输出 "rCzi,…,z,) 不 恒 等 于 0". 


定理 11.3 上 述 算法 在 多 项 式 时 间 内 运行 . 当 (zi,…',zv) 恒 等 于 0 时 ,算法 输出 正确 
结果 ; 当 (zl,…,z,) 不 恒 等 于 0 时 ,算法 至 少 以 9/(40m) 概 率 输出 正确 结果 . 

证 每 个 a 的 长 度 为 O00) 位 ,a ,… a, 的 总 长 度 为 O(nm) 位 ,k 的 长 度 为 OC(m) 位 ， 
所 有 运算 的 中 间 结 果 的 长 度 也 都 为 0(m) 位 . 同 余 算术 中 加 法 减法、 乘法 都 是 多 项 式 时 间 
的 ,所 以 上 述 算法 在 多 项 式 时 间 内 运行 . 

当 r(Czm…,z) 恒 等 于 0 时, 无论 什 么 值 代入 后 都 等 于 零 , 所 以 算法 总 是 输出 正确 结果 . 

当 (zi ,… ,Xx) 不 恒 等 于 0 时 ,Pr[ rCay,…,a,) 关 0 ] 宇 9/10. 这 是 因为 ,车 电路 C 的 规 
模 为 mm, 则 当 这 m 个 门 都 是 乘法 的 话 ,r 的 次 数 deg(7) 最 多 可 到 2” ,于 是 根据 施 华 兹 - 齐 普 


尔 引 理 | 该 引 理 说 ,从 有 限 域 的 子 集 S 中 随机 取 值 wm .as.…,as 时 ,有 PrLr(a ,oo) 一 0 过 


, 设 a 都 从 S 二 {1,…,2") 中 随机 取 值 , 则 


Pr[lrlai,* sa) 一 0] 委 deg(r) /1S| 委 2"/(10。2”) = 1/10 

当 y 一 r(a,… ,an) 天 0 时 ,Pr[y 隆 0 (mod A) ] 宇 1/(4m). 这 是 因为 ,根据 素数 定理 ,{1,…， 
2 所 } 中 的 素数 至 少 有 2”/(2m) 个 ,而 y 的 素数 因子 至 多 有 logy 夺 5m2” 个 , 当 m 宇 11 时 ， 
2 /(2m) 一 5m2" 宇 2”/(4m), 因 此 ,{1,…,2”}) 中 的 素数 至 少 有 2*”/(4m) 个 都 不 是 y 的 素 
因子 , 当 取 这 些 值 时 ,y 隆 0 (mod A). 所 以 
Pr[y 关 0 (mod A)] > (2”/(4m))/2" = 1/(4m) 
因此 ,算法 至 少 以 (9/10)。 (1/4m) 二 9/(40m) 的 概率 正确 输出 7 不 恒 等 于 零 . 当 m 夺 10 

时 ,只 有 有 限 多 种 情况 ,可 以 列 在 一 个 表 中 ,算法 通过 查 表 来 给 出 结果 ,只 花费 常数 时 间 , 出 
错 概 率 为 0. 
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通过 独立 重复 执行 上 述 算法 O(m) 次 ,就 能 把 出 错 概率 降低 到 1/3 以 下 . 
11.5 随机 游 动 算法 


本 节 介 绍 利用 有 限 马 氏 链 来 分 析 随 机 游 动 算法 的 基本 方法 .随机 游 动 算法 是 常见 的 启发 
式 方 法 ,虽然 描述 起 来 很 简单 ,但 用 来 求解 一 些 难 解 问题 时 , 却 常常 有 胜 过 其 他 方法 的 好 效果 . 
我 们 以 二 元 布尔 可 满足 性 问题 为 例 , 给 出 用 随机 游 动 算法 求解 二 元 布尔 可 满足 性 问题 的 多 项 
式 时 间 随 机 算法 ,并 利用 有 限 马 氏 链 对 这 个 算法 进行 分 析 . 对 于 很 多 难 解 问题 ,比如 一 般 布尔 
可 满足 性 问题 和 货 郎 问题 ,随机 游 动 算法 也 是 到 目前 为 止 实际 效果 最 好 的 求解 策略 之 一 . 


11.5.1 有 限 马 民 链 及 其 表示 


一 个 离散 随机 过 程 就 是 一 组 随机 变量 X={X,|iET,T 是 可 数 集 ) ,通常 上 代表 时 间 ,X， 
就 是 X 在 时 刻 : 的 状态 . 例如 ,一 个 赌 徒 每 次 抛 一 枚 均匀 硬币 来 赌博 ,如 果 正 面向 上 ,他 赢 1 
元 钱 ,如 果 反 面向 上 ,他 输 一 元 钱 . 假设 他 的 初始 赌 本 为 Xo, 在 时刻 1 的 赌 本 为 X,, 则 
{X11 二 0,1,2,…} 就 是 一 个 离散 随机 过 程 . 一 个 有 限 马 氏 链 是 满足 下 列 条 件 的 离散 随机 过 
程 {Xo ,Xi , 义 :,…} ,其 中 每 个 X, 都 从 一 个 有 限 集中 取 值 : 

WB 一 站 区] 
Pr[LX, a 瑟 b] po.a 
即 X, 的 值 依赖 于 X,-; 的 值 , 而 不 依赖 于 在 此 之 前 如 何 到 达 X,-; 这 个 值 的 历史 . 例如 ,在 上 
述 赌 徒 的 例子 中 , 当 b5 隆 0 或 n 时 ， 
了 中 一 二 
PE = 二 略 
B= 114 = = 
Pi[X, =68—1| Xs =€] 下 /区 
即 posti= ps6-1=1/2. 

对 于 有 限 马 氏 链 ,不 妨 设 X, 取 值 的 状态 空间 为 ‘0,1,2,…,n). 于 是 pi;,; 可 组 成 一 个 nn 十 
1 阶 方 阵 P 了 = 二 [pi jorvxorv ,叫做 一 步 转移 矩阵 . 其 每 一 行 元 素 之 和 等 于 1, 即 对 任意 i, 有 
2)pii = 1. 设 pi(1) 表示 在 时 刻 1 处 在 状态 i 的 概率 , 则 


一 十 一 二 
设 p(t) 表 示 向 量 (po (Pipri(t) ,pr(1)), 则 p(t) 二 p(t 一 1)P. 对 任意 m, 定 义 
妈 步 转移 矩阵 


1 | Xi = bXes 一 aceXo 一 ao] 


P'™ 一 [Lp ]obxertD 
其 中 


pl? = PrLXun 一 了 | Xe 一 可 
于 是 P=P" ,p(t+m)= p(t)P”. 
有 限 马 氏 链 还 可 以 用 有 向 带 权 图 来 表示 ,每 个 状态 作 
为 一 个 顶点 ,两 个 状态 i,j 之 间 的 有 向 边 所 带 的 权 就 是 这 
两 个 状态 之 间 的 转移 概率 pi;,; ,如 图 11. 1 所 示 就 是 一 个 三 


图 11.1 一 个 有 限 马 氏 链 


磊 夫 算法 


状态 马 氏 链 . 
11.5.2 求解 二 元 布尔 可 满足 性 问题 的 随机 游 动 算 法 


如 果 合 取 范 式 的 每 一 个 简单 析 取 式 最 多 只 有 2 个 文字 , 则 称 这 种 合 取 范式 为 2 元 合 取 
范式 . 当 限 制 SAT 实例 中 的 合 取 范 式 为 2 元 合 取 范 式 时 , 称 作 二 元 可 满足 性 , 即 
二 元 可 满足 性 (2SAT): 任 给 一 个 2 元 合 取 范 式 下 , 问 下 是 可 满足 的 吗 ? (2SAT 与 
3SAT 的 定义 方式 稍 有 不 同 ,在 3SAT 中 要 求 每 一 个 简单 析 取 式 恰 好 有 3 个 文字 . 这 是 为 了 
使 得 其 实例 更 加 整齐 一 些 , 更 方便 构造 多 项 式 时 间 变 换 . 其 实 ,规定 它 的 简单 析 取 式 最 多 有 
3 个 文字 也 是 一 样 的 . ) 
本 节 介 绍 求解 二 元 布尔 可 满足 性 问题 的 随机 游 动 算法 ,然后 用 马 氏 链 来 分 析 这 个 算法 . 
算法 11.4 求解 二 元 布尔 可 满足 性 问题 的 随机 游 动 算法 
输入 : 一 个 有 个 变 元 和 mm 个 子 句 的 合 取 范 式 ,每 个 子 句 至 多 有 两 个 文字 . 
输出 : 一 个 满足 赋值 ,或 者 宣布 没有 满足 赋值 . 
1. 任意 给 所 有 变量 赋值 ; 
2. 如 果 当 前 赋值 是 满足 赋值 , 则 输出 这 个 赋值 ,算法 结束 ; 
3. 均匀 随机 选 一 个 不 满足 子 句 ,从 中 均匀 随机 选 一 个 文字 ,改变 该 文字 的 赋值 ; 
4. 重复 第 2 一 3 步 2mm? 次 ,车 一 直 没有 找到 满足 赋值 , 则 宣布 没有 满足 赋值 . 
定理 11.4 若 输 入 公式 是 不 可 满足 的 , 则 上 述 随 机 游 动 算法 正确 宣布 其 不 可 满足 . 若 
输入 公式 是 可 满足 的 , 则 上 述 算 法 以 1 一 1/2” 概率 找到 一 个 满足 赋值 . 
证 显然 , 当 输 入 公式 是 不 可 满足 的 ,算法 无 法 找到 满足 赋值 ,因此 将 宣布 不 可 满足 ; 当 
输入 公式 可 满足 时 ,算法 有 可 能 找 不 到 满足 赋值 而 出 错 . 我 们 证 明 算法 出 错 的 概率 为 1/2”. 
假设 输入 公式 可 满足 , 设 a* 是 某 个 满足 赋值 .a, 是 算法 在 执行 1 遍 第 3 步 以 后 的 赋值 ， 
X, 等 于 a* 和 a, 赋值 相同 的 变量 个 数 . 令 变 量 数 为 nn, 则 当 X, 二 n 时 a 一 a" ,算法 将 找到 满 
足 赋 值 a* 而 停止 . 注意 ,在 X, 二 n 之 前 ,算法 也 可 能 找到 别 的 满足 赋值 而 停止 . 
当 X, 二 0 时 ,a* 和 a 赋值 相同 的 变量 个 数 为 0. 修改 任何 一 个 变量 的 赋值 ,都 会 让 a* 
和 ww 赋值 相同 的 变量 个 数 增加 1 个 , 即 Xi 一 1, 所 以 Pr[X,n 二 1|X, 二 0]==1. 当 X,=j 且 
0 三 j 志 n 一 1 时 ,a* 和 ww 赋值 相同 的 变量 个 数 为 j. 修改 某 一 个 变量 的 赋值 ,只 会 让 a* 和 a 
赋值 相同 的 变量 个 数 增加 1 个 或 减少 1 个 , 即 X =7 十 1 或 Xi 一 7 一 1. 假 设 算法 选择 修 
改 子 句 C 二 a V5 的 一 个 变量 的 赋值 .根据 算法 的 定义 可 以 知道 ,在 赋值 a, 之 下 C 是 不 满足 
子 句 , 所 以 在 赋值 a, 之 下 <“ 王 0 一 假 . 由 于 假定 a* 是 满足 赋值 ,因此 在 a* 下 .一 真 且 0 一 假 ， 
或 w 王 假 且 0 王 真 ,或 一 0 一 真 . 因 此 随机 选择 改变 或 2 的 赋值 时 ,至 少 有 一 半 机 会 让 a* 
和 a; 赋值 相同 的 变量 个 数 增加 1 个 .所 以 Pr[ Xin=j 十 1|X,=j ] 写 1/2,Pr[L X=j 一 1| 
X, 二 j ] 委 1/2. 注 意 {Xo ,Xi ,Xes,…)} 可 能 不 是 马 氏 链 , 因 为 PrLX,+i 一 /十 1|1X, 一 门 可 能 不 是 
常数 ,这 个 值 可 能 是 1/2 或 1, 这 与 a* 和 ao: 赋值 相同 的 变量 具体 是 哪些 个 变量 有 关 . 
为 了 利用 马 氏 链 来 进行 分 析 ,我 们 定义 一 个 真正 的 马 氏 链 {Yo ,mm ,7Ys，…} 如 下 : 
区 二 区 
Pr[Ym =1|Y,=0]=1 
Pr[Ym = j++1|Y,=j]=1/2 
Pr[Ym =j—1|Y,=j]= 1/2 
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注意 到 

| 

Pi Yn 一 也 | 区 三 广 ] 三 W2 字 BL Nin 三 #1| 妥 三 并 
从 任意 状态 出 发 ,Y, 将 比 X, 花费 更 长 的 期 望 时 间 才 能 进入 状态 .下 面 分析 Y, 进入 状态 7 
所 需要 的 期 望 时 间 , 以 此 作为 算法 期 望 运行 时 间 的 上 界 . 注意 , 马 氏 链 Y= 二 {Yo ,Yi ,Ys，…} 
可 以 用 图 11. 2 所 示 的 带 权 有 向 图 表示 . 


1 0.5 0.5 0.5 
UK 扩 迪 - 当 忆 
0,5 0,5 0.5 1 


图 11.2 马 氏 链 Y 


设 h 表示 从 状态 j 到 达 状 态 n 的 期 望 运行 时 间 , 则 有 二 0 和 加 二 加 十 1, 对 于 其 他 j 
值 有 


后 三 计 Ciin 十 DD 十 六 (ii 十 D 
用 归纳 法 容易 证 明 , 对 于 所 有 j, 有 hj; 三 x 一 产 二 mw. 因此， 


ELX 从 Xe 到 达 的 时 间 ] 三 E[Y 从 YY。 到达 的 时 间 ] 三 
由 马尔 科 夫 不 等 式 有 


Pr[X 从 Xe。 到达) 的 时 间 二 222] 三 1/2 

即 若 以 222 步 为 一 个 阶段 , 则 在 一 个 阶段 中 算法 找 不 到 满足 赋值 的 出 错 概率 不 超过 1/2. 当 
重复 执行 每 个 阶段 m 次 , 即 总 共 执 行 2mm? 步 时 ,算法 仍然 找 不 到 满足 赋值 的 出 错 概 率 就 小 
天 了 和 

对 于 三 元 可 满足 性 问题 来 说 ,也 可 以 用 随机 游 动 算法 来 求解 .但 期 望 运行 时 间 不 再 是 多 
项 式 时 间 的 ,而 是 指数 时 间 的 了 . 在 实际 求解 布尔 可 满足 性 问题 时 ,随机 游 动 算法 是 效果 比 
较 好 的 一 种 方法 . 当 它 与 基于 统计 物理 的 消息 传递 算法 配合 使 用 时 ,求解 三 元 可 满足 问题 的 
随机 实例 可 以 达到 上 百 万 个 变量 .我 们 将 在 第 12 章 介 绍 随机 地 产生 各 种 难 解 算 例 的 方法 和 
基于 统计 物理 的 消息 传递 算法 . 


到 题 . 重 


11.1 证 明 切 诺 夫 界 . 

11.2 证 明 在 随机 算法 定义 中 ,可 以 把 平均 运行 时 间 为 多 项 式 的 要 求 改 为 最 坏 运行 时 间 为 
多 项 式 的 要 求 . 

11.3 证 明 可 以 通过 独立 重复 运行 .把 有 效 随机 算法 的 错误 概率 降低 到 输入 规模 的 指数 的 
倒数 . 

11.4 给 出 中 位 数 问题 的 随机 算法 ,并 分 析 期 望 运行 时 间 . 

11.5 利用 多 项 式 恒 等 检验 ,设计 并 分 析 一 个 求解 二 部 图 完美 匹配 问题 的 随机 算法 . 

11.6 用 随机 游 动 算法 求解 三 元 可 满足 性 问题 ,并且 分 析 算 法 的 期 望 运行 时 间 . 


第 章 
= 处 理 难 解 问 题 的 策略 


在 第 9 章 中 我 们 看 到 ,很 多 有 趣 的 计算 问题 都 是 NP 完全 或 NP 难 的 ,这 就 意味 着 ,这 
些 问 题 在 最 坏 情 况 的 复杂 性 度量 下 很 可 能 没有 多 项 式 时 间 的 精确 算法 , 即 这 些 问 题 是 所 谓 
的 难 解 问题 . 到 目前 为 止 ,已 经 有 成 百 上 千 个 常见 的 计算 问题 被 证 明 为 NP 完全 或 NP 难 
的 ,所 以 难 解 问题 的 存在 是 一 种 普遍 现象 . 为 了 从 理论 上 更 深入 地 研究 难 解 问题 ,也 为 了 满 
足 实 际 工作 中 的 需要 ,经 过 近 几 十 年 的 努力 ,人 们 逐渐 积累 了 一 些 处 理 难 解 问题 的 策略 ,这 
些 策略 主要 包括 对 问题 施加 限制 .多 项 式 时 间 近 似 算法 、 固 定 参 数 算法 、 改 进 的 指数 时 间 精 
确 算法 .启发 式 方法 ,平均 情形 的 复杂 性 分 析 、 量 子 算法 等 . 本 章 将 系统 地 介绍 这 些 策略 ,对 
于 第 10 章 已 经 专门 介绍 过 的 多 项 式 时 间 近 似 算法 ,这 里 不 再 重复 . 

NP 完全 性 理论 是 基于 最 坏 情况 下 的 复杂 性 度量 , 当 考 虑 平均 情况 的 复杂 性 度量 时 ,就 
会 发 现 有 些 NP 完全 问题 在 平均 复杂 性 度量 下 是 易 解 的 ,这 使 得 平均 情况 的 复杂 性 分 析 也 
成 了 对 付 难 解 性 的 方法 之 一 . 近年 来 ,人 们 利用 统计 物理 的 模型 来 研究 典型 实例 , 即 在 概率 
趋 近 于 1 意义 下 的 绝 大 多 数 实例 ,发 现 了 典型 实例 往往 具有 相 变 现象 ,最 难 解 的 实例 全 都 集 
中 在 可 满足 性 相 变 点 附近 ,人 们 因此 设计 出 基于 相 变 现象 来 产生 难 解 算 例 (benchmarks) 的 
方法 ,在 算法 研究 和 算法 竞赛 中 得 到 成 功 的 应 用 ,人 们 还 开发 了 与 传统 算法 不 同 的 基于 统计 
物理 的 消息 传递 算法 ,在 随机 实例 的 求解 上 取得 了 很 大 的 进展 . 对 于 这 些 方面 的 进展 ,本 章 
也 将 简单 地 加 以 介绍 . 


12.1 对 问题 施加 限制 


假如 已 经 知道 一 个 问题 是 NP 难 的 ,但 是 在 实际 中 遇 到 的 可 能 只 是 这 个 问题 的 某 种 特 
殊 情 况 , 即 这 个 问题 的 某 种 子 问题 . 当然 ,这 个 子 问 题 可 能 仍然 是 NP 难 的 ,但 也 有 可 能 是 多 
项 式 时 间 可 解 的 ,因此 必须 进一步 地 认真 分 析 . 在 一 个 问题 的 NP 完全 性 证 明 中 ,所 构造 的 
实例 往往 是 复杂 的 和 人 为 的 ,这样 的 实例 在 实际 工作 中 可 能 很 少 出 现 或 根本 不 会 出 现 . 换 句 
话说 ,人 们 实际 遇 到 的 实例 ,很 可 能 带 有 一 些 结构 上 的 限制 ,并 不 像 NP 完全 性 证 明 中 人 为 
构造 的 实例 那样 复杂 . 对 原 问题 施加 这 些 限制 之 后 .这 些 带 有 限制 的 子 问题 就 可 能 变 得 容易 
解决 了 . 本 节 考 虑 如 何 对 一 般 的 难 解 问题 施加 限制 .使 得 特殊 的 子 问题 变 得 容易 解决 . 我 们 
以 布尔 公式 的 可 满足 性 问题 (简称 SAT) 为 例 , 在 第 9 章 中 已 经 证 明了 一 般 的 SAT 问题 是 
NP 完全 的 ,甚至 连 限制 每 个 子 句 恰好 包含 3 个 文字 的 3SAT 问题 也 是 NP 完全 的 。 但 是 在 
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第 11 章 随 机 算法 中 我 们 看 到 ,如 果 限 制 每 个 子 句 只 包含 两 个 文字 , 即 二 元 可 满足 性 问题 ( 简 
称 2SAT 问题 ) ,那么 2SAT 就 可 以 用 随机 游 动 算法 在 多 项 式 期 望 时 间 内 求解 . 其 实 2SAT 也 
有 多 项 式 时 间 的 确定 型 算法 ,下 面 就 简单 介绍 这 个 算法 . 


12.1.1 二 元 可 满足 性 问题 


设计 2SAT 算法 如 下 : 设 2 元 合 取 范式 下 有 n 个 变 元 zx1,xs，…,x, 和 wm 个 简单 析 取 式 
Ci CC 每 个 Ci 至 多 有 2 个 文字 . 例如 ,Ci = 二 x1V mmyC = 二 X19C3 = 二 了 了 XIV Tz 
Ci: 一 nzCs 一 zVzyCe 一 nzVnmzmyCr 一 ”zaVz 假设 存在 只 有 一 个 文字 的 简单 析 
取 式 , 任 取 其 中 的 一 个 Cj 二 ,如果 存 在 满足 下 的 赋值 :2, 则 必 有 :(=) 一 1. 于 是 , 令 上 (z) 一 1， 
即 当 = 王 zi; 时 , 令 Lizi) 王 1; 当 zx 一 ”zi 时, 令 2zi) 王 0. 为 方便 起 见 , 当 < 一 z 时 , 记 一 z 一 
”2zi3 当 z 一 ”2 时, 记 ”< 一 zi 将 = 的 值 代 人 下, 每 个 Ce 有 下 述 几 种 可 能 : 

(1) C==zV y= 二 1V y= 二 1, 从 下 中 删 去 C,; 

(2) Gi 二 了 zxV y= 二 0V y= 二 y,C 变 成 只 含 一 个 文字 的 简单 析 取 式 ; 

(3) CGC 二 z= 二 1, 从 下 中 删 去 C，; 

(4) Ct 二 -x 二 0, 这 是 矛盾 式 ; 

(5) C4 既 不 含 = ,也 不 含 =, 保 持 不 动 . 
如 此 重复 进行 ,直至 出 现下 述 3 种 情况 中 的 1 种 为 止 : 
@ 出 现 矛 盾 式 , 即 出 现 (4); 

@ 删 去 了 所 有 的 简单 析 取 式 ; 

@ 剩 下 的 简单 析 取 式 都 有 2 个 文字 . 

把 上 述 过 程 称 为 化 简 . 看 上 面 的 例子 ,Cs 只 含 一 个 文字 zi , 令 tCz1) 二 1, 删 去 C1 和 C;， 
把 Cs 改 成 C= 二 x2. 令 tC 了 zo) 二 1, 即 t(xs)=0, 删 去 Cs 和 C4. 剩 下 Cs==x3 VCe 一 
”zsynzsCr 一 ”zaVzi, 这 是 情况 @@， 

如 果 第 1 次 化 简 的 结果 是 情况 ,出 现 矛 盾 式 , 则 下 是 不 可 满足 的 ,计算 结束 . 如 果 结 
果 是 情况 @, 则 赋值 1 已 满足 所 有 的 简单 析 取 式 . 故 下 是 可 满足 的 . 剩 下 情况 @ 需 要 继续 进 
行 ,这 时 已 无 法 确定 任何 剩 下 的 变 元 的 赋值 . 于是, 任 取 一 个 剩 下 的 变 元 x, 令 1(x) 二 1 和 
t(z) 一 0 分 别 进行 化 简 . 如 果 2 次 化 简 的 结果 都 是 情况 中 , 则 下 是 不 可 满足 的 ,计算 结束 . 如 
果 有 一 次 的 结果 是 情况 @, 则 整个 赋值 (前 面 的 赋值 加 上 这 次 化 简 的 赋值 ) : 已 满足 所 有 的 
简单 析 取 式 , 故 下 是 可 满足 的 ,计算 结束 . 如 果 有 一 次 化 简 的 结果 是 情况 @, 则 取 定 这 次 化 
简 中 的 赋值 ,然后 对 剩余 的 变 元 和 简单 析 取 式 重复 上 述 过 程 ,直至 出 现 前 两 种 情况 为 止 . 继 
续 上 面 的 例子 , 令 txzs) 王 1, 删 去 Cs ,把 Cs 和 C 改 成 Cs 二 了 zx4. C1 二 zx4. 令 tz) 二 1, 删 去 
Ci ,Cs 二 0, 得 到 情况 .再 令 i(xs) 二 0, 重 新 进行 化 简 . 删 去 Cs 和 C ,把 Cs 改 成 Cs 二 zz. 令 
t(z4) 二 1, 删 去 Cs ,得 到 情况 @. 这 时 zx1) 二 1,t(xz) 二 0,1(xs3) 二 0,1(x4) 二 1, 这 是 下 的 一 
个 满足 赋值 , 故 下 是 可 满足 的 . 

现在 估计 这 个 算法 的 时 间 复 杂 度 . 每 次 化 简 显 然 可 在 O(m) 步 内 完成 ,关键 是 发 现 每 一 
个 变 元 至 多 经 过 2 次 化 简 , 从 而 总 共 至 多 进行 2n 次 化 简 . 故 算法 的 时 间 复 杂 度 为 O(nm)， 
其 中 是 变 元 数 ,m 是 简单 析 取 式 的 个 数 . 得 证 2SATEP. 
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12.1.2 震 恩 公式 可 满足 性 问题 


下 面 我 们 再 对 SAT 问题 施加 另 一 种 限制 ,这 次 限制 每 个 子 句 具有 特殊 的 形式 , 即 让 每 
个 子 句 中 正文 字 ( 不 带 和 否定 号 的 变量 ) 至 多 出 现 一 次 ,这 样 的 子 句 称 为 霍 恩 (Horn) 子 句 , 昌 
霍 恩 子 句 构 成 的 公式 称 为 霍 恩 公式 ,输入 限制 为 专 恩 公式 的 SAT 问题 称 为 霍 恩 SAT 问题 ， 
简写 为 HornSAT, 由 于 霍 因 公式 在 人 工 智能 和 逻辑 推理 中 起 着 重要 作用 ,考虑 这 样 的 限制 
是 有 实际 意义 的 . 下 面 证 明 HornSAT 具有 一 个 简单 的 多 项 式 时 间 算 法 ,这 个 算法 不 仅 正确 
地 判定 霍 恩 公式 是 否 可 满足 ,而 且 在 可 满足 的 情况 下 ,直接 给 出 一 个 满足 赋值 . 

算法 12.1 求解 HornSAT 的 多 项 式 时 间 算 法 

输入 : 一 组 霍 因子 句 ( 即 每 个 子 句 至 多 包含 一 个 正文 字 ). 

输出 : 一 个 满足 赋值 或 宣布 没有 满足 赋值 . 


1. 把 所 有 变量 赋值 为 假 . 

2. 循环 检查 所 有 蕴涵 子 句 ( 即 带 一 个 正文 字 的 子 句 ), 只 要 还 有 不 满足 的 ,就 把 该 子 句 中 唯一 的 正文 
字 的 变量 赋值 为 真 . 

3. 检查 所 有 的 纯 负 子 句 ( 即 不 含 正文 字 的 子 句 ) , 若 没有 不 满足 的 , 则 输出 当前 赋值 ,算法 结束 ;否则 ， 
宣布 没有 满足 赋值 . 


定理 12.1 上 述 算法 在 公式 长 度 的 平方 时 间 内 正确 求解 HornSAT. 

证 首先 证 明 上 述 算法 在 公式 长 度 的 平方 时 间 内 运行 ,在 这 里 用 公式 长 度 ;( 即 公式 中 
变量 出 现 的 总 次 数 ) 作 为 输入 规模 的 度量 . 上 述 算法 的 第 1 步 为 每 个 变量 赋值 ,至 多 花费 
O(n) 步 ,其 中 n 是 不 同 变量 的 总 数 , 注 意 n 总 是 不 超过 s. 第 2 步 循环 检查 的 总 次 数 不 超 过 斑 
涵 子 句 的 个 数 , 因 为 每 次 发 现 一 个 不 可 满足 的 蕴涵 子 句 ,就 把 该 子 句 中 的 唯一 正文 字 的 变量 
赋值 为 真 ,从 而 满足 了 该 子 句 .而 这 样 被 满足 的 蕴涵 子 句 不 会 重新 变 得 不 满足 ,因为 算法 从 
不 把 赋值 为 真 的 变量 再 次 赋值 为 假 , 所 以 每 个 蕴涵 子 句 至 多 有 一 次 被 发 现 不 满足 ,因此 循环 
的 总 次 数 不 超 过 蕴涵 子 句 的 个 数 , 而 蕴涵 子 句 的 个 数 不 超 过 公式 的 总 长 度 s. 在 每 个 循环 内 
部 ,检查 所 有 的 蕴涵 子 句 是 否 都 被 满足 ,只 需要 扫描 一 遍 输入 公式 ,检查 每 个 比 涵 子 句 中 是 
否 至 少 有 一 个 文字 取 值 为 真 .以 及 相应 地 为 变量 赋值 ,这些 都 不 超过 线性 时 间 O(s) ,因此 整 
个 第 2 步 花费 的 时 间 不 超过 公式 长 度 的 平方 时 间 O(s*). 第 3 步 检查 是 否 有 不 满足 的 纯 负 
子 句 ,与 第 2 步 的 一 次 循环 类 似 , 也 只 花费 O(s) 时 间 . 所 以 算法 总 的 运行 时 间 是 公式 长 度 的 
平方 时 间 OCs?). 

其 次 证 明 上 述 算 法 的 正确 性 . 如 果 算 法 返回 一 个 赋值 ,那么 这 个 赋值 一 定 是 可 满足 
赋值 ,这 是 因为 算法 在 返回 赋值 前 ,已 经 先 确 认 了 没有 不 满足 的 子 句 . 注意 霍 恩 公 式 中 的 
子 句 要 么 是 蕴涵 子 句 ,要 么 是 纯 负 子 句 , 第 2 步 保证 了 一 定 没有 不 满足 的 蕴涵 子 句 ,第 3 
步 则 只 在 确认 没有 不 满足 的 纯 负 子 句 时 , 才 返 回 赋值 ,所 以 算法 返回 的 赋值 一 定 是 满足 
赋值 . 

接 下 来 需要 证 明 , 当 算法 宣布 没有 满足 赋值 时 ,也 是 正确 的 . 为 此 ,考虑 算法 的 执行 
过 程 . 当 算法 在 第 1 步 把 所 有 变量 都 赋值 为 假 时 ,所 有 包含 有 负 文 字 ( 即 带 否 定 号 的 变 
量 ) 的 子 句 就 都 被 满足 了 . 这 时 在 第 2 步 最 早 检 查 出 的 不 满足 子 句 都 只 包含 正文 字 , 而 根 
据 霍 恩 子 句 的 定义 ,每 个 子 句 中 至 多 包含 一 个 正文 字 , 因 此 这 个 子 句 恰好 由 一 个 正文 字 
构成 .于 是 为 了 满足 这 个 子 句 , 在 第 2 步 就 必须 给 这 个 变量 赋值 为 真 . 而 在 第 2 步 循环 体 
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内 , 随 着 一 些 变 量 被 赋值 为 真 ,可 能 有 些 原来 通过 负 文 字 取 值 为 真 来 满足 的 蕴涵 子 句 又 
变 得 不 满足 ,这 时 就 必须 把 这 些 蕴涵 子 句 中 的 正文 字 赋 值 为 真 . 换 句 话说 ,在 第 2 步 中 每 
次 把 一 个 变量 的 赋值 由 假 改 为 真 , 都 是 必需 的 , 即 在 所 有 可 能 的 满足 赋值 中 ,这 些 变 量 都 
必须 被 赋值 为 真 , 因 为 只 有 这 样 ,才能 满足 相关 的 那些 蕴涵 子 句 . 这 样 一 来 ,如 果 这 样 的 
赋值 还 不 能 满足 所 有 的 纯 负 子 句 ,那么 就 不 可 能 再 有 其 他 的 满足 赋值 了 ,因此 算法 的 第 3 
步 确实 给 出 正确 的 结果 . 

上 面 以 可 满足 性 问题 为 例 ,说 明了 可 以 通过 施加 限制 条 件 , 而 让 一 般 难 解 的 SAT 问题 
的 特殊 子 问题 变 成 易 解 的 . 类 似 的 例子 还 有 一 些 图 论 的 难 解 问题 , 当 限 制 输入 的 无 向 图 为 
树 、 二 部 图 ,平面 图 等 ,或 者 限制 项 点 的 度 不 超过 某 个 固定 值 时 ,这 些 特殊 的 子 问 题 也 可 能 变 
成 易 解 的 ,例如 ,图 的 着 色 问 题 , 当 图 的 色 数 不 超过 2 时 ,就 是 易 解 的 . 又 如 ,如 果 限 制图 的 项 
点 度数 都 不 超过 一 个 固定 的 常数 & ,那么 求 最 大 团 的 问题 是 多 项 式 时 间 可 解 的 .采用 简单 的 
穷 举 搜索 ,因为 顶点 度数 不 超过 4d ,最 大 团 中 最 多 有 d 十 1 个 顶点 , 故 只 需要 检查 所 有 d 十 1 个 


n 


顶点 就 能 找到 最 大 团 . 设 有 nn 个 顶点 , 任 取 d 十 1 个 本 点 有 | ) 和 可 能 .检查 d 十 1 个 顶点 


d 

之 间 的 相 邻 关系 只 需 O((d 十 1)2) 一 O(1) 次 运算 , 共 需 ol -oo ) 次 运算 . 这 是 
a 

多 项 式 时 间 算 法 . 当然 , 当 4d 较 大 时 ,这 个 算法 是 没有 实用 价值 的 . 


12.2 固定 参数 算法 


通常 把 优化 问题 转化 为 判定 问题 时 ,都 会 在 输入 中 引入 一 个 参数 ,比如 图 的 最 小 顶点 效 
盖 问 题 ,输入 是 一 个 无 向 图 G, 输 出 是 一 个 最 小 的 顶点 集 , 使 得 每 条 边 都 至 少 有 一 个 端点 在 
这 个 集合 中 . 把 这 个 最 小 化 问题 转化 为 判定 问题 时 ,输入 就 变 成 (G,k), 其 中 k 是 0 与 n 之 
间 的 整数 ,n 是 G 的 顶点 数 ,而 问题 则 变 成 判断 G 中 是 否 有 一 个 大 小 不 超过 的 顶点 覆盖 ， 
这 个 判定 问题 的 一 个 平凡 解法 就 是 穷 举 所 有 可 能 的 人 元 顶点 子 集 , 看 看 其 中 有 没有 一 个 项 


点 覆盖 . 这 样 的 算法 的 复杂 度 大 约 是 olo 人 jj=oww ) ,对 于 国定 的 人 ,这 个 运行 时 间 是 


多 项 式 的 ,但 即便 对 于 中 等 大 小 的 人 ,比如 &A 一 10, 当 图 的 规模 较 大 时 ,比如 2 一 1000, 则 运行 
时 间 依 然 是 令 人 无 法 忍受 的 .比如 对 于 上 述 规模 的 实例 就 有 10 * 1000” 二 10 ,在 每 秒 运算 
百 万 次 的 计算 机 上 ,至 少 需 要 10* 秒 ,这 个 时 间 比 宇宙 年 龄 还 要 大 几 个 数量 级 ! 幸运 的 是 ， 
我 们 可 以 设计 出 运行 时 间 为 O(2*kn) 的 算法 ,这 样 在 上 述 计 算 机 上 只 需 花 上 几 秒 钟 就 能 解 
决 这 种 规模 的 实例 . 

我 们 把 输入 中 带 有 一 个 参数 &, 当 输入 规模 为 n 时 .运行 时 间 为 O(f(k)n') 的 算法 , 称 为 
固定 参数 算法 (Fixed-Parameter Algorithms) 或 参数 化 算法 (Parameterized Algorithms) ,这 
里 的 /(k) 是 与 n 无关 的 函数 ,c 是 与 2 和 A 都 无 关 的 常数 . 对 于 固定 参数 算法 来 说 , 当 A 是 
常数 时 ,算法 的 运行 时 间 是 多 项 式 的 . 如 果 这 时 碰巧 fA(k) 和 cc 都 比较 小 , 则 这 样 的 算法 是 对 
平凡 的 穷 举 算法 的 有 力 改进 ,对 于 比较 大 的 输入 规模 都 还 是 有 效 的 .正如 上 面 的 例子 所 表明 
的 ,固定 参数 算法 不 失 为 一 种 用 来 对 付 难 解 性 的 方法 . 而 当 f(k) 和 cc 至少 有 一 个 比较 大 时 ， 
这 样 的 算法 往往 也 只 具有 理论 上 的 价值 ,比如 当 k==40 时 ,上 述 算法 在 上 述 机 器 上 就 要 运行 
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几 年 时 间 . 

参数 的 选择 具有 一 定 自由 度 , 可 以 是 问题 的 任何 一 个 有 意义 的 参数 ,不 一 定 仅 限于 把 
优化 问题 转化 为 判定 问题 时 所 引入 的 那个 参数 ,比如 可 以 是 图 中 顶点 的 最 大 度 等 . 同一 个 问 
题 对 于 不 同 的 参数 要 分 别 加 以 考虑 ,可 能 对 有 些 参 数 存在 固定 参数 算法 ,而 对 于 其 他 参数 又 
不 存在 这 样 的 算法 . 下面 我 们 就 以 顶点 覆盖 问题 为 例 ,介绍 上 面 提 到 的 O(2*kn) 时 间 的 固定 


算法 12.2 顶点 覆盖 问题 的 固定 参数 算法 

输入 : 一 个 阶 无 向 简单 图 G. 

参数 : 希望 找到 的 顶点 覆盖 的 规模 上 界 人 ,其 中 0<k<=n. 

输出 : 一 个 大 小 不 超过 A 的 顶点 覆盖 或 宣布 没有 这 样 的 顶点 覆盖 . 

1. 检查 G 的 边 集 , 若 没有 边 , 则 输出 空 集 为 顶点 覆盖 ,算法 结束 . 

2. 若 边 数 超过 k(n 一 1) , 则 宣布 没有 大 小 不 超过 的 顶点 覆盖 ,算法 结束 . 

3. 任 选 一 条 边 (w,u) ,递归 地 检查 G 一 {u} 和 G 一 {v) 是 否 具 有 大 小 不 超过 4k 一 1 的 顶点 覆盖 . 

3.1 若 它们 都 没有 , 则 宣布 G 没有 大 小 不 超过 A 的 顶点 覆盖 ,算法 结束 . 

3.2 若 它们 中 至 少 一 个 有 ,比如 说 G 一 人 fx} 有 大 小 不 超过 A 一 1 的 顶点 覆盖 T, 则 输出 TU {ww} 为 G 的 
大 小 不 超过 k 的 顶点 覆盖 . 


定理 12.2 上述 算法 在 O(2*%kn) 时 间 内 正确 地 解决 大 小 不 超过 上 的 顶点 获 盖 问题 . 


证 先 来 证 明 上 述 算法 的 正确 性 .第 1 步 显 然 是 对 的 ,因为 若 G 中 没有 边 , 则 按照 顶点 
覆盖 的 定义 , 空 集 就 是 顶点 覆盖 . 再 看 第 2 步 ,由 于 简单 图 中 一 个 顶点 的 最 大 度 不 能 超过 


超过 k(n 一 1) ,所 以 第 2 步 是 对 的 . 

下 面 证 明 第 3 步 也 是 对 的 . 先 假设 G 中 存在 大 小 不 超过 A 的 顶点 覆盖 S ,那么 按照 顶点 
覆盖 的 定义 ,对 于 任意 一 条 边 (w,u) 来 说 ,& 和 w 中 至 少 有 一 个 要 属于 S ,不 妨 设 v 属 于 S ,于 
是 S 一 {x)} 就 要 覆盖 所 有 不 与 & 关 联 的 边 , 即 S 一 {z 是 G 一 {z 的 大 小 不 超过 & 一 1 的 顶点 
覆盖 .再 假设 G 一 {u)} 和 G 一 {1v} 中 至 少 有 一 个 具有 大 小 不 超过 一 1 的 顶点 覆盖 ,不 妨 设 
G 一 {u} 有 大 小 不 超过 一 1 的 顶点 覆盖 了 ,于 是 TU {u} 就 覆盖 G 中 所 有 的 边 , 即 G 中 存在 
大 小 不 超过 A 的 顶点 覆盖 . 这 样 我 们 就 证 明了 .G 中 存在 大 小 不 超过 A 的 顶点 覆盖 , 当 且 仪 
当 对 于 任意 一 条 边 (u,v) 来 说 ,G 一 {u} 和 G 一 {v} 中 至 少 有 一 个 具有 大 小 不 超过 k 一 1 的 顶 
点 覆盖 ,所 以 第 3 步 也 是 正确 的 . 

由 于 每 次 递归 都 让 图 中 减少 一 个 顶点 和 至 少 一 条 边 ,所 以 在 有 限 步 递归 之 后 ,第 1 步 或 
第 2 步 的 条 件 将 被 满足 ,算法 将 从 递归 中 返回 ,所 以 算法 不 存在 死 循 环 . 这 样 就 证 明了 上 述 
算法 的 正确 性 . 

下 面 证 明 上 述 算法 的 时 间 复 杂 性 为 O(2*kn) 时 间 . 假设 T(n.k) 表 示 算 法 在 nn 阶 图 和 参 
数 & 上 的 运行 时 间 , 则 对 于 某 个 常数 c,T(n.k) 满 足下 述 递 推 公式 : 

本人 A 
于 (ap 2 一 1 一 了 十 DSS ZT(nvwk Oo 1) hn 
对 & 三 1 进行 归纳 ,可 证 明 T(n.k) 三 c2*kn . 即 假设 T(n.k 一 1) 夺 c2*1(k 一 1)n, 则 
Tn,k) 过 2T(n.k 一 1) 十 cn ( 递 推 公式 ) 
委 2c2 中 (一 1)n 十 cn 【〔 归 纳 假设 ) 


第 
12 
章 
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= c2tkn — c2472 十 ckn 
过 - 认 全 页 《因为 2 站 污 
关于 固定 参数 算法 ,已 经 系统 地 发 展 了 很 多 设计 方法 和 分 析 技 巧 ,也 发 展 了 相应 的 复杂 
性 理论 ,例如 , 跟 NP 完全 理论 类 似 , 这 里 有 W[1] 完 全 的 概念 ,如 果 证 明 一 个 问题 是 W[1] 
完全 或 W[1] 难 的 , 则 很 可 能 这 个 问题 就 没有 固定 参数 算法 ,有 兴趣 的 读者 可 以 参阅 关于 固 
定 参 数 算法 的 论文 或 专著 [20]. 


12.3 改进 指数 时 间 算 法 


12. 2 节 介 绍 的 固定 参数 算法 是 对 平凡 的 穷 举 算法 的 有 力 改进 ,本 节 继 续 在 更 一 般 的 情 
况 下 , 即 不 考虑 参数 的 作用 的 情况 下 ,考虑 如 何 改进 平凡 的 穷 举 算法 ,以 得 到 改进 的 指数 时 
间 精 确 算法 . 当 一 个 问题 的 平凡 穷 举 算法 为 0*2") 时 间 时 ,这 里 的 O* 记号 表示 忽略 了 多 项 
式 因 子 , 即 07(2") 一 O(0z222 2"), 则 对 于 任何 满足 1 二 c 二 2 的 常数 c, 把 时 间 复 杂 性 为 
O*(e") 的 指数 时 间 算 法 称 为 非 平 凡 的 指数 时 间 算 法 ,或 改进 的 指数 时 间 算 法 . 当 我 们 不 满足 
于 近似 解 而 必须 要 求 精确 解 的 时 候 , 指 数 时 间 精 确 算法 就 是 有 用 的 ,而 改进 的 指数 时 间 算 法 
则 允许 精确 地 求解 更 大 规模 的 实例 , 比如 , 当 一 个 指数 时 间 的 算法 的 时 间 复 杂 性 为 
O(1.01") 时 ,这 样 的 算法 在 "一 1000 规模 的 输入 上 , 比 O(02 ) 的 算法 还 要 快 几 十 倍 , 所 以 改 
进 的 指数 时 间 精 确 算 法 不 失 为 对 付 难 解 性 的 又 一 种 方法 . 

下 面 我 们 以 SAT 问题 为 例 , 来 说 明 如 何 得 到 改进 的 指数 时 间 精 确 算 法 . 我 们 知道 ， 
SAT 问题 是 NP 完全 问题 ,平凡 的 穷 举 算法 的 时 间 复 杂 性 是 O"(2"), 即 穷 举 n 个 变量 的 所 
有 2" 种 不 同 赋值 .我 们 还 知道 , 当 限 制 每 个 子 句 包含 不 超过 A 个 文字 时 , 即 考虑 ASAT 时 ， 
当 k 二 2 时 ,2SAT 是 易 解 的 ,而 当 k 宇 3 时 ,3SAT,4SAT,5SAT… 都 是 NP 完全 的 ,对 于 这 些 
施加 限制 之 后 仍然 难 解 的 问题 ,我们 可 以 设计 出 改进 的 指数 时 间 精 确 算法 . 下面 用 3SAT 问 
题 来 举例 说 明 这 样 的 改进 算法 . 

算法 12.3 3SAT 的 指数 时 间 改 进 算法 

输入 : 一 个 合 取 范 式 , 每 个 子 句 最 多 包含 3 个 文字 . 

输出 : 一 个 满足 赋值 上 或 宣布 这 个 公式 是 不 可 满足 的 . 

1. 令 G=F; 

2. 车 G= 儿 , 则 输出 1, 计算 结束 ;车 G 包含 空 语句 , 则 宣布 G 是 不 可 满足 的 ; 

3. 任 取 一 个 子 句 C=al V us V as ,其 中 a; 都 是 文字 ,1<A<3, 执 行 下 述 4 步 ; 

3.1 令 ta) 一 1, 删 去 所 有 含 wm 的 子 句 , 把 所 有 含 一 的 子 句 D= 一 aa V D' 换 成 D' ,其 中 D' 可 能 是 

空子 句 , 即 一 一 一 wm V 邹 . 记 化 简 后 得 到 的 公式 为 G'. 对 G' 递 归 地 运用 算法 2 一 4; 
3.2 令 ta) 一 0,t(az) 一 1, 类 似 上 面 化 简 , 记 化 简 后 得 到 的 公式 为 G'. 对 G' 递 归 地 运用 算法 2 一 4; 
3.3 令 ta) 一 0,t(oz) 一 0,t(os) 一 1, 类 似 上 面 化 简 , 记 化 简 后 得 到 的 公式 为 G'. 对 G' 递 归 地 运用 算 
法 2 一 4; 

若 上 述 & 步 都 宣布 G' 是 不 可 满足 的 , 则 宣布 G 是 不 可 满足 的 . 

4. 车 宣布 G 是 不 可 满足 的 , 则 下 是 不 可 满足 的 ,计算 结束 . 

定理 12.3 上 述 算法 在 O*(1. 8393") 时 间 内 正确 求解 3SAT. 

证 我 们 先 来 证 明 上 述 算法 的 正确 性 . 当 算法 在 第 2 步 输出 一 个 赋值 时 ,这 个 赋值 的 确 
是 满足 赋值 ,因为 算法 检查 过 该 赋值 是 满足 赋值 . 下 面 证 明 当 算法 宣布 没有 满足 赋值 时 ,也 
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是 正确 的 . 如 果 输 入 公式 中 含有 某 个 子 句 C= 二 a V as V as , 则 所 有 满足 赋值 被 划分 为 3 类 : 

第 1 类 : 把 wm 赋值 为 真 ; 

第 2 类 : 把 w 赋值 为 假 ,把 a; 赋值 为 真 ; 

第 3 类 : 把 wm 赋值 为 假 ,把 cs 赋值 为 假 ,把 ws 赋值 为 真 . 

任何 一 个 满足 赋值 必定 属于 且 仅 属于 上 述 一 类 . 算法 在 第 3 步 递归 地 检查 所 有 的 情况 ， 
当 3.1 一 3. 3 步 所 有 递归 检查 都 失败 时 ,也 就 是 说 上 述 3 类 赋值 中 都 没有 满足 赋值 时 ,输入 
公式 必定 没有 满足 赋值 ,因为 任何 一 个 满足 赋值 必定 属于 上 述 3 类 之 一 ,所 以 这 时 算法 在 第 
3 步 宣布 没有 满足 赋值 ,就 是 正确 的 . 

由 于 每 次 递归 至 少 为 一 个 变量 赋值 ,因此 每 个 递归 检查 的 深度 至 多 为 n, 即 算法 不 存在 
死 循环 . 这 样 就 证 明了 算法 是 正确 的 . 

下 面 分 析 算 法 的 复杂 性 . 设 T(n) 表 示 算 法 在 个 变量 的 公式 上 的 运行 时 间 , 设 公式 中 
有 光 w 个 子 句 , 则 m 二 O(nm), 因 为 每 个 子 句 至 多 含有 3 个 文字 ,不 同 子 句 的 个 数 至 多 为 
OGE). 关 于 T(n) ,与 定理 12.2 证 明 中 类 似 , 有 下 列 递 推 公式 

T(n) T(xn—1)++Tn—2)+T(n— 3)++O(ntm) 
按照 参考 文献 [1] 中 介绍 的 递 推 公式 的 解法 ,这 个 递 推 公式 的 解 是 T(n) 二 O*(1. 8393") ,其 
中 1. 8393 是 方程 ”= 二 十 4 十 1 的 最 大 根 . 

上 述 3SAT 的 改进 算法 远 不 是 最 优 的 ,截止 到 2010 年 年 底 , 目 前 3SAT 的 指数 时 间 精 
确 算法 的 最 好 结果 是 : 有 一 个 O*(1. 321") 时 间 的 随机 算法 ,和 一 个 O*(1.439") 时 间 的 确定 
型 算法 . 对 于 其 他 的 ASAT 问题 ,也 有 类 似 的 改进 算法 . 而 对 于 一 般 的 SAT 问题 , 则 目前 还 
不 知道 是 否 有 非 平凡 的 改进 算法 . 改进 NP 完全 问题 的 指数 时 间 精 确 算法 ,目前 是 一 个 活跃 
的 研究 方向 ,一些 几 十 年 没有 解决 的 问题 都 在 近期 获得 突破 .例如 ,任意 色 数 的 图 的 顶点 着 
色 问 题 都 有 O*3") 的 算法 ,背包 问题 有 比 O"(2”) 更 好 的 算法 , 货 郎 问题 也 有 比 O*(2") 更 好 
的 算法 ,而 在 未 来 如 果 对 于 SAT 问题 设计 出 比 O*(2") 更 好 的 算法 ,将 是 算法 领域 和 理论 计 
算 机 科学 领域 的 重要 进展 . 

对 于 改进 的 指数 时 间 精 确 算法 ,也 有 一 些 复杂 性 理论 方面 的 研究 ,例如 ,有 人 就 猜想 
ASAT 的 指数 时 间 算 法 的 底数 不 能 任意 地 小 ,这 就 是 所 谓 的 指数 时 间 假 设 (exponential time 
hypothesis,ETH): 对 于 每 个 正 整 数 k, 都 存在 常数 二 0, 使 得 求解 ASAT 的 精确 算法 时 间 
复杂 性 不 低 于 O*(2%”). 上 述 的 指数 时 间 假 设 仅仅 是 针对 ASAT 而 言 的 ,对 于 其 他 的 难 解 问 
题 ,也 可 以 有 类 似 的 假设 ,但 假设 的 具体 指数 形式 可 能 不 同 . 所 有 这 些 指 数 时 间 假 设 都 比 复 
杂 性 理论 中 另 一 个 著名 假设 P 关 NP 更 强 . 由 指数 时 间 的 假设 就 能 得 出 P 取 NP 的 结论 ,因为 
P 关 NP 是 排除 了 难 解 问题 的 多 项 式 时 间 算 法 .而 指数 时 间 假 设 则 说 难 解 问 题 只 有 指数 时 间 
的 算法 , 连 OCzee ) 时 间 这 样 的 算法 也 都 排除 掉 了 . 更 进一步 地 ,有 人 猜想 解决 NP 完全 问题 
这 类 难 解 问题 ,无 论 采 用 何 种 计算 模型 和 何 种 物理 实现 ,包括 各 种 可 能 的 物理 手段 .生物 手 
段 或 化 学 手段 等 ,所 消耗 的 资源 量 都 是 指数 量 级 的 ,这 里 的 资源 除了 时 间 和 空间 外 ,还 可 以 
是 能 量 或 质量 等 其 他 物理 量 或 化 学 量 . 这 样 的 假设 对 于 更 深刻 地 理解 我 们 所 处 世界 的 本 性 ， 
以 及 对 于 一 些 应 用 来 说 ,比如 基于 难 解 性 假设 的 现代 密码 学 ,都 是 具有 重要 意义 的 . 而 研究 
这 些 假 设 的 途径 .无 外 乎 尝试 去 证 明 或 推翻 这 些 假 设 . 证 明 主要 依赖 于 各 种 下 界 技术 ,推翻 
主要 依赖 于 各 种 算法 技术 ,而 尝试 改进 指数 时 间 算 法 ,对 于 推翻 这 些 假 设 来 说 ,就 是 最 基本 
的 一 个 出 发 点 . 有 趣 的 是 .在 一 定 场合 下 甚至 可 以 通过 改进 指数 时 间 算 法 来 证 明 下 界 , 感 兴 
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趣 的 读者 可 参阅 论文 [21]. 


12.4 启发 式 方 法 


前 面 介绍 的 各 种 方法 ,都 在 理论 上 有 明确 的 性 能 保证 . 例如 ,在 限制 法 中 证 明 受 限制 的 
问题 属于 了 类 ,在 近似 算法 中 给 出 近似 比 ,在 固定 参数 算法 和 改进 指数 时 间 算 法 中 给 出 非 
平凡 的 时 间 界 限 . 除 此 之 外 ,人 们 发 现 还 有 一 类 方法 ,目前 无 法 从 理论 上 给 出 任何 性 能 保证 ， 
但 在 实践 中 却 效果 良好 ,就 把 这 类 方法 统称 为 启发 式 方法 (heuristics). 常用 的 启发 式 方法 
主要 包括 回溯 法 、 分 支 限界 法 、 局 部 搜索 法 .遗传 算法 等 .第 5 章 介 绍 了 回溯 法 和 分 支 限 界 
法 ,这 里 不 再 重复 ,第 11 章 介 绍 的 随机 游 动 算法 也 属于 局 部 搜索 法 ,下 面 主 要 介绍 一 种 改进 
的 局 部 搜索 算法 , 称 为 模拟 退火 法 ,这 是 在 实践 中 求解 优化 问题 效果 较 好 的 一 种 启发 式 
方法 . 

局 部 搜索 法 也 称 为 局 部 改进 法 ,其 求解 优化 问题 的 基本 策略 是 : 先 产生 一 个 初始 解 , 然 
后 对 这 个 解 做 出 局 部 修改 ,看 看 解 的 性 能 是 否 有 所 改进 . 若是 , 则 用 改进 的 解 代替 原来 的 解 ; 
否则 就 保留 原来 的 解 . 如 此 这 般 重复 执行 ,直到 用 完 预 先 设 定 的 循环 次 数 后 ,就 输出 所 见 过 
的 最 好 解 . 这 个 算法 的 性 能 依赖 于 问题 的 邻 域 结构 , 即 如 何 对 当前 的 解 做 出 局 部 修改 ,也 依 
赖 于 局 部 最 优 解 的 数目 和 分 布 ,因为 一 旦 算法 进入 一 个 局 部 最 优 解 , 就 有 可 能 陷入 其 中 而 跳 
不 出 来 . 为 了 克服 局 部 最 优 解 ,人 们 想到 应 当 随 机 选择 初始 解 ,这 称 为 随机 化 策略 
(randomization) ,还 想到 应 当 让 算法 在 不 同 的 初始 解 上 重新 开始 多 运行 几 次 ,这 称 为 重启 策 
略 (restart) ,这 两 种 策略 都 能 增加 找到 全 局 最 优 解 的 机 会 . 

更 加 有 趣 的 想法 是 ,应 当 偶 尔 让 退步 解 ( 即 性 能 变 差 的 解 ) 代 蔡 当 前 解 ,这 样 就 能 增加 从 
局 部 最 优 解 中 跳出 来 的 机 会 . 在 国体 冷却 的 物理 过 程 中 , 当 温度 较 高 时 ,分 子 的 活动 范围 较 
大 :, 当 温度 逐渐 降低 时 ,分 子 的 活动 范围 就 越 来 越 小 . 受 此 现象 启发 ,人 们 引入 一 个 参数 T， 
称 为 温度 , 温度 越 高 ,用 退步 解 代 替 当 前 解 的 几率 就 越 大 ,但 如 果 退 步 的 幅度 A 越 大 ,这 个 
几率 就 应 当 越 小 . 受 物理 学 原理 的 启发 ,可 以 让 这 个 概率 等 于 e *. 随 着 解 的 性 能 不 断 提高 ， 
应 当 让 温度 逐渐 降低 ,这 种 策略 就 称 为 模拟 退火 . 

算法 12.4 ”模拟 退火 法 

输入 : 一 个 优化 问题 的 实例 . 

输出 : 一 个 可 行 解 . 

1. 生成 一 个 初始 解 , 设 定 初始 温度 Ti. 

2. 循环 执行 下 列 步 驴 , 直 到 T=0. 

2.1 从 当前 解 的 邻 域 中 随机 选择 一 个 新 解 . 

2.2 车 新 解 是 改进 解 , 则 代替 当前 解 ;否则 设 新 解 的 退步 幅度 为 A, 以 概率 -用 新 解 代 蔡 当前 解 . 
2 
3. 


.3 更 新 温度 工 . 

- 输出 见 到 的 最 好 的 解 . 

上 述 算法 2. 3 步 中 更 新 温度 工 的 方式 , 称 为 算法 的 退火 时 间 表 .是 算法 的 关键 . 应 当 根 
据 当前 解 的 性 能 来 更 新 温度 ,初始 温度 通常 较 高 ,而 随 着 当前 解 的 性 能 越 来 越 好 ,温度 就 应 
越 来 越 低 . 在 直观 上 ,用 退步 解 代 替 当 前 解 的 几率 取决 于 退步 幅度 和 温度 . 温度 越 高 ,就 越 积 
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极地 搜索 退步 幅度 较 大 的 解 , 以 增加 从 局 部 最 优 解 中 跳出 的 几率 . 而 随 着 温度 降低 ,就 减少 
搜索 退步 幅度 较 大 的 解 ,以 降低 从 全 局 最 优 解 中 跳出 的 几率 . 

算法 中 的 另 一 个 重要 因素 是 解 的 邻 域 结构 . 例如 对 于 SAT 问题 来 说 ,如 果 两 个 赋值 只 
在 一 个 变量 上 不 同 ,就 认为 它们 彼此 相 邻 ,就 是 一 种 很 自然 的 邻 域 结构 ,第 11 章 中 的 随机 游 
动 算法 中 正 是 这 样 做 的 . 


12.5 平均 情形 的 复杂 性 


如 本 章 开 头 所 述 ,NP 完全 性 理论 是 基于 最 坏 情 形 下 的 复杂 人 性 度量 , 当 考虑 平均 情形 的 
复杂 性 度量 时 ,就 会 发 现 有 些 NP 完全 问题 在 平均 复杂 性 度量 下 是 易 解 的 ,这 使 得 平均 情形 
的 复杂 性 分 析 也 成 了 对 付 难 解 性 的 方法 之 一 . 本 节 举 一 个 这 样 的 例子 ,这 个 例子 就 是 哈密 顿 
回路 问题 . 可 以 证 明 在 平均 情形 的 复杂 度 性 度量 下 ,哈密 顿 回路 问题 有 多 项 式 时 间 的 算法 . 

为 了 考虑 平均 情形 的 复杂 性 度量 ,首先 要 在 所 有 输入 上 定义 一 个 概率 分 布 . 对 于 无 向 简 
单 图 来 说 ,一 种 自然 的 选择 就 是 经 典 的 随机 图 模型 G(n,p). 在 Gln,p) 中 让 图 的 顶点 数 为 
,然后 在 任何 两 个 不 同 顶点 之 间 独 立地 以 概率 p 连 一 条 边 . 对 于 任何 一 个 妈 阶 简单 图 互 来 
说 , 设 甩 有 m 条 边 , 则 Gl(n,p)== 昌 的 概率 为 p"(1 一 p)"* ?2-", 当 p==1/2 时 ,G(n,1/2) 
就 是 所 及 阶 简单 图 上 的 一 个 均匀 分 布 . 

算法 12.5 哈密 顿 回路 问题 在 Gln,1/2) 上 的 有 效 算法 

输入 : 在 Gn,1/2) 分 布下 产生 的 一 个 随机 图 G. 

输出 : G 中 的 一 条 哈密 顿 回路 . 

反复 利用 下 面 两 条 规则 构造 一 条 路 径 已 直到 P 不 能 再 延长 为 止 . 
1.1 车 PP 外 的 顶点 zx 与 P 的 端点 v 相 邻 , 则 用 边 (z,w) 把 x 加 入 PP, 即 令 P=zP. 


Xx 
ohm 


1.2 车 P=wvP'yzP” 且 wv 与 < 相 邻 .y 与 P 外 的 顶点 x 相 邻 , 则 令 P 王 zyP'us<P” 


ve ————4= 
yh--ex 一 
pA 


2. 反复 利用 下 面 两 条 规则 构造 一 个 圈 C. 
2.1 车 P=vP'zyP”w 且 v 与 > 相 邻 .zw 与 zx 相 邻 , 则 令 C= 二 wzP'vyP”w. 
pe 


2.2 车 P==vP'zyP”"w'w 且 w 与 > 相 邻 、w 与 x 相 邻 , 则 令 C= 二 wzP'vyP"w'. 
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3 
3. 反复 利用 下 面 3 条 规则 把 其 余 顶 点 加 入 C, 每 次 加 入 1 个 或 2 个 顶点 ,直到 没有 剩余 项 点 为 止 . 
3.1 若 C 外 的 顶点 z 与 C 上 连续 两 点 > 和 x 都 相 邻 , 则 令 C 一 CU{Cy,z)，Czyz)} 一 {(Cy,>)). 


3.2 车 C 外 的 2 点 x 和 y 相 邻 且 分 别 与 C 上 连续 2 点 w 和 w 相 邻 , 则 令 C 一 CU{Cueyz),Czyy)，Cy， 
0)}—{(u,v)}. 


>i 
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3.3 车 C=abP'yzP"a 且 C 外 的 顶点 x 与 a 和 y 都 相 邻 6 与 相 邻 , 则 令 C=azyP'bzP'a. 


| Wd 
A (> 
4. 输出 C 作为 哈密 顿 回路 . 


定理 12.4 上 述 算法 在 G(n,1/2) 上 以 大 概率 在 O(n ) 时 间 内 输出 哈密 顿 回 路 . 

证 首先 我 们 明确 一 下 ,在 这 里 “以 大 概率 ”(with high probability, 简 称 w. h. p. ) 的 意 
思 是 , 随 着 nn 趋 于 无 穷 , 上 述 算法 能 有 效 找 出 哈密 顿 回 路 的 Gln,1/2) 随 机 图 的 概率 趋 于 1， 
这 个 概率 不 是 随机 算法 在 某 个 输入 上 的 成 功 概率 .而 是 上 述 算法 在 随机 输入 上 的 成 功 概率 . 
以 下 只 给 出 证 明 的 大 致 思路 ,而 把 细节 留 做 习题 . 

利用 第 11 章 中 介绍 的 切 诺 夫 界 ,容易 证 明 G 以 大 概率 满足 以 下 3 条 性 质 ( 设 N(v) 表 


示 顶 点 v 的 邻 域 ): 

性 质 一 : 对 每 个 顶点 v,|N(v)| 介 于 n/2 土 n/50 之 间 . 

性 质 二 : 对 每 对 顶点 和 u,|NCue)UNCo)| 介 于 3n/4 士 n/50 之 间 . 

性 质 三 : 对 每 3 个 顶点 wv 和 忆 ,|NGDUN(Gv) UN(w)| 介 于 7n/8 士 n/50 之 间 . 
利用 这 些 性 质 ,容易 证 明 : 

- 算法 在 第 1 步 构造 的 路 径 P 上 至 少 有 7z/8 一 n/50 个 顶点 . 

- 在 第 2 步 构造 的 圈 C 上 至 少 有 7z/8 一 n/50 一 1 个 顶点 . 

- 在 第 3 步 上 只 要 还 有 边 的 两 端 都 在 圈 C 之 外 . 则 可 以 应 用 3. 1 步 或 3.2 步 ,因此 第 3 

步 总 是 可 行 的 . 


因此 以 大 概率 ,上 述 算法 找 出 G 的 哈密 顿 回路 . 
容易 看 出 ,算法 的 第 1 一 3 步 每 一 步 都 可 在 O(Cz ) 时 间 内 实现 ,因此 上 述 算 法 在 O(Gz ) 
时 间 内 运行 . 


处 理 难 解 问题 的 身 略 


关于 平均 情形 的 复杂 性 分 析 , 也 已 经 发 展 出 整套 的 复杂 性 理论 ,与 P 和 NP 类 对 应 的 
复杂 性 类 是 DistP( 或 AvgP) 和 DistNP 类 ,与 NP 完全 性 的 概念 类 似 ,这 里 也 有 DistNP 完 
全 的 概念 ,而 证 明 一 个 问题 是 DistNP 完全 的 , 则 这 个 问题 很 可 能 就 在 平均 情形 下 是 难 解 
的 ,例如 可 以 证 明 图 着 色 问 题 在 平均 情况 下 是 易 解 的 ,而 铺 砖 问题 则 在 平均 情况 下 是 难 
解 的 . 


12.6 难 解 算 例 生 成 


在 研究 算法 的 过 程 中 ,从 理论 上 分 析 一 个 算法 ,给 出 算法 性 能 的 渐 近 比较 紧 的 界 , 这 往 
往 是 一 件 很 困难 的 任务 ,比如 前 面 介绍 的 启发 式 方法 等 . 因此 人 们 需要 产生 一 些 难 解 的 算 例 
(benchmarks) ,用 来 测试 和 比较 不 同 算法 的 性 能 ,这 在 算法 的 教学 和 研究 中 都 起 着 重要 作 
用 ,有 的 学 者 称 为 算法 试金石 . 过 去 人 们 曾经 拿 工 业界 的 一 些 实际 问题 作为 算 例 ,这 些 问 题 
的 规模 比较 大 ,因此 看 起 来 似乎 是 难 解 的 . 但 是 后 来 发 现 ,这 些 问题 由 于 来 源 于 实际 问题 ,所 
以 往往 带 有 特定 的 结构 ,导致 其 中 存在 少数 一 些 变 量 , 称 为 后 门 变量 (backdoors) ,只 要 确定 
了 这 些 变 量 的 取 值 ,整个 问题 就 非常 容易 解决 . 比如 ,一 个 包含 几 千 个 变量 的 布尔 公式 ,其 中 
后 门 变量 的 个 数 只 有 几 十 个 . 因此 只 要 穷 举 包含 几 十 个 变量 的 子 集 和 这 些 变 量 的 不 同 取 值 ， 
就 能 比 基 于 完全 穷 举 法 的 其 他 方法 快 很 多 信 地 解决 这 些 问题 . 后 来 人 们 找到 了 更 好 的 办 法 
来 产生 真正 难 解 的 算 例 ,这 就 是 随机 产生 的 算 例 ,这 些 算 例 的 难 解 性 来 源 于 下 面 介绍 的 相 变 
现象 . 


12.6.1 相 变 现象 与 难 解 性 


如 果 用 一 个 随机 过 程 来 产生 实例 ,并 且 通 过 一 些 参 数 来 控制 这 个 随机 过 程 ,那么 经 常会 
出 现 所 谓 的 相 变现 象 : 存在 参数 的 一 个 临界 值 . 实 例 的 性 质 在 临界 点 两 侧 发 生 了 很 大 的 突 
变 , 具 有 某 个 性 质 的 概率 在 一 侧 随 实例 规模 趋 于 无 穷 而 渐 近 为 0, 在 另 一 侧 则 随 实 例 规模 趋 
于 无 穷 而 渐 近 为 1. 例如 ,可 满足 性 相 变 是 说 ,在 临界 值 的 一 侧 , 以 很 大 的 概率 产生 有 解 的 实 
例 ,而 在 临界 值 的 另 一 侧 , 以 很 大 的 概率 产生 无 解 的 实例 . 人 们 通过 实验 发 现 , 最 难 解 的 实例 
都 集中 在 可 满足 性 相 变 临界 值 的 附近 . 只 有 在 远离 临界 值 的 地 方 . 实 例 才 会 变 得 容易 解决 . 
甚至 在 距离 临界 值 还 有 一 段 距离 的 地 方 ,所 有 已 知 的 算法 就 都 失效 了 ,因此 人 们 就 用 临界 值 
附近 的 实例 作为 难 解 算 例 . 

以 约束 满足 问题 为 例 ,约束 满足 问题 是 对 于 布尔 公式 可 满足 性 、 图 着 色 等 NP 完全 问 
题 的 一 种 自然 推广 . 在 约束 满足 问题 的 实例 中 .给 定 一 些 变量 和 这 些 变量 之 间 的 一 些 约 
束 , 每 个 约束 规定 了 一 些 变量 之 间 各 种 取 值 的 相 容 组 合 .问题 是 寻找 变量 的 赋值 ,以 满足 
所 有 的 约束 . 为 了 产生 约束 满足 问题 的 随机 实例 .人 们 提出 过 A.B,C,D 四 种 模型 , 设 0 二 
Pi 三 1 和 0 二 ps 二 1 是 两 个 控制 参数 , 设 有 nn 个 变量 . 设 每 个 变量 有 4 种 取 值 ,g>0 是 正 
整数 . 

A 模型 ”在 可 能 的 n(n 一 1)/2 对 变量 中 .每 对 变量 以 概率 pi 成 为 约束 ,也 就 是 在 
n(n 一 1)/2 对 变量 中 ,每 对 变量 以 概率 pi 被 选 出 组 成 约束 . 对 于 每 个 给 定 的 约束 ,在 d? 对 
赋值 中 ,每 组 赋值 以 概率 ps 成 为 不 相 容 赋值 . 

B 模型 ”在 可 能 的 n(n 一 1)/2 对 变量 中 .随机 选择 pin(n 一 1)/2 对 变量 成 为 约束 ,也 就 
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是 在 n(n 一 1)/2 对 变量 中 ,以 等 概率 挑选 一 个 有 pin(n 一 1)/2 对 变量 的 子 集 组 成 约束 集 . 对 
于 每 个 给 定 的 约束 ,在 d? 对 赋值 中 ,随机 挑选 pd? 个 成 为 不 相 容 赋值 . 

C 模 型 ”在 可 能 的 n(n 一 1)/2 对 变量 中 .每 对 变量 以 概率 包 成 为 约束 ,也 就 是 在 
n(n 一 1)/2 对 变量 中 ,每 对 变量 以 概率 p, 被 选 出 组 成 约束 . 对 于 每 个 给 定 的 约束 ,在 d? 对 
赋值 中 ,随机 挑选 pd? 个 成 为 不 相 容 赋值 . 

D 模 型 ”在 可 能 的 n(n 一 1)/2 对 变量 中 ,随机 选择 pin(n 一 1)/2 对 变量 成 为 约 东 ,也 就 
是 在 n(n 一 1)/2 对 变量 中 ,以 等 概率 挑选 一 个 有 pin(n 一 1)/2 对 变量 的 子 集 组 成 约束 集 . 对 
于 每 个 给 定 的 约束 ,在 d? 对 赋值 中 ,每 组 赋值 以 概率 ps 成 为 不 相 容 赋值 . 

但 是 后 来 发 现 这 些 模型 有 所 谓 渐 近 无 解 性 ,这 种 性 质 损 害 了 它们 作为 随机 算 例 的 用 处 . 
就 是 说 , 当 参 数 确定 时 ,在 变量 个 数 变 成 充分 大 时 ,这 些 模 型 产生 的 实例 基本 上 是 没有 解 的 ， 
即 解 的 个 数 将 趋 近 于 0. 具体 来 说 ,将 X 作为 表示 解 的 个 数 的 随机 变量 ,使 用 马尔 科 夫 不 等 
式 有 Pr[1X| 宇 1]<ELX]. 通过 计算 XX 的 期 望 ,可 以 得 到 

和 


EGO = 4d (1 一 pm(:) = [za 一 户 ) 


显然 为 了 避免 imE(CX) 一 0, 必 须 保证 d 宇 (一 ps)-m 卫 对 于 B 模型, 当 约 东 紧 度 ps 宇 1/4 
时 ,实例 有 人 解 的 概率 随 变 量 数 n 趋 于 无 穷 大 而 趋 近 于 0; 对 于 A 模型 ,车 p, 宇 0, 则 实例 有 解 
的 概率 就 将 趋 近 于 0. 这 就 说 明 , 当 变量 个 数 充 分 大 以 后 ,在 多 数 情 况 下 ,A 模型 和 了 BB 模型 所 
生成 的 随机 实例 几乎 是 无 解 的 ,将 不 会 出 现 相 变 现象 ,因此 难以 产生 真正 的 难 解 实例 . 人 们 
后 来 也 找到 了 解决 渐 近 无 解 性 的 办 法 ,其 中 一 种 比较 成 功 的 模型 称 为 RB 模型 .意思 是 对 B 
模型 的 修订 ,这 是 首 个 在 理论 上 严格 地 证 明了 存在 既 有 精确 相 变 现象 又 有 难 解 实例 的 NP 
完全 问题 的 随机 模型 . 


算法 12.6 为 RB 模型 产生 随机 实例 
输入 : 参数 组 二 k,n,a,r,p, 其 中 
-每 个 约束 由 个 不 重复 的 变 元 组 成 ,k 是 大 于 等 于 2 的 整数 ; 
-nn 是 变 元 个 数 ; 
-每 个 变 元 的 值 域 大 小 为 4 二 nw ,a 是 正常 数 ; 
-至 多 有 mm 二 rnlnn 个 约 东 .~ 是 正常 数 .控制 约束 的 密度 ; 
-Pp 是正 常数 ,控制 约束 的 紧 度 ,0 二 p=1. 
输出 : 在 RB 模型 中 产生 的 随机 实例 . 
1. 有 重复 地 选择 m= 二 rnlnn 个 随机 约束 ,每 个 约束 由 个 不 重复 的 变 元 组 成 . 
2. 对 每 个 约束 ,均匀 随机 无 重复 地 选择 g 王 pad* 个 不 相 容 赋 值 , 因 此 相 容 赋值 的 个 数 为 (1 一 pd 个 . 


定理 12.5 设 k,a> 二 ,p< 和 部 是 常数 , 令 六 . 则 


t= 
lIn(1—p) 
1 当 7 过 yp 时 
洲 型 的 实 入 ] 一 
Pr[RB 模型 的 随机 实例 是 可 满足 的 ] 上 和 
定理 12.6 设 ka> 广 ,7 过 -各部 是 常数 , 令 po 一 1 一 e, 则 
1 当 p 二 ps 时 
0 当 p 二 ps 时 
这 两 个 定理 的 证 明 主要 应 用 概率 方法 中 的 一 阶 矩 法 和 二 阶 矩 法 ,我 们 略 去 其 证 明 . 由 这 


Pr[RB 模型 的 随机 实例 是 可 满足 的 ] 一 | 
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个 定理 可 以 看 出 ,存在 着 能 精确 计算 出 来 的 参数 + 和 pp 的 阔 值 ,在 阔 值 两 侧 随 着 ” 趋 于 无 
穷 ,随机 实例 的 可 满足 概率 分 别 趋 于 0 和 1. 还 可 以 证 明 , 把 这 样 产 生 的 随机 实例 转化 为 
SAT 实例 后 , 随 着 n 趋 于 无 穷 ,这 些 实例 以 大 概率 具有 指数 地 归结 复杂 度 ,由 于 归结 法 是 求 
解 SAT 的 基本 方法 ,因此 在 理论 上 RB 模型 产生 的 实例 是 难 解 的 . 


12.6.2 隐藏 解 的 难 解 算 便 


一 个 更 难 的 问题 是 不 但 要 产生 难 解 实例 ,而 且 要 产生 已 知 解 的 难 解 实例 . 普通 方法 产生 
的 难 解 实例 ,由 于 其 难 解 性 ,有 时 候 甚 至 连 产生 者 自己 也 不 知道 解 .有 一 类 算法 称 为 不 完全 
算法 ,比如 随机 游 动 算法 ,即使 在 解 存在 的 情况 下 .这 类 算法 也 不 能 保证 一 定 能 够 找到 解 . 对 
于 不 完全 算法 来 说 ,使 用 不 知道 解 的 算 例 来 测试 性 能 ,就 会 遇 到 问题 . 比如 当 算法 没有 找到 
解 时 ,就 无 从 判断 算法 的 结果 的 正确 性 .因此 人 们 需要 构造 带 有 植 和 人 解 (planted solution) 的 
难 解 算 例 ,就 是 预先 隐藏 了 一 个 已 知 的 解 的 难 解 算 例 . 对 于 优化 问题 来 说 ,还 要 在 算 例 中 隐 
藏 一 个 最 优 解 . 在 这 个 方面 ,RB 模型 也 具有 很 好 的 性 质 ,不 仅 能 产生 植 和 人 解 的 判定 问题 的 
难 解 算 例 ,甚至 还 能 产生 隐藏 着 最 优 解 的 难 解 算 例 . 
算法 12.7 产生 隐藏 着 解 或 最 优 解 的 算 例 
输入 : 一 组 控制 参数 . 
输出 : 隐藏 解 或 最 优 解 的 算 例 . 
1. 选 定 一 个 要 隐藏 的 解 或 最 优 解 . 
2. 按照 控制 参数 规定 的 方式 随机 产生 算 例 的 各 个 约束 ,但 每 产生 一 个 约束 ,就 要 检查 这 个 约束 是 否 
与 要 隐藏 的 解 矛盾 ,如 果 不 矛 盾 则 保留 这 个 约束 ,否则 就 丢弃 这 个 约束 ,直到 产生 足够 多 的 约束 得 
到 一 个 算 例 为 止 . 
3. 输出 最 后 得 到 的 算 例 . 


显然 这 样 产生 的 算 例 以 隐藏 的 解 或 最 优 解 作为 一 个 解 或 最 优 解 .但 是 应 用 这 个 简单 的 
策略 有 时 会 引起 问题 ,例如 对 于 随机 SAT 问题 来 说 (随机 3SAT 的 定义 在 12.7.2 节 ), 这 样 
隐藏 解 之 后 ,随机 算 例 的 解 的 数目 和 解 的 分 布 都 发 生 了 很 大 变化 .导致 隐藏 解 之 后 的 算 例 变 
得 容易 求解 了 . 幸运 的 是 ,在 RB 模型 上 这 个 策略 却 很 有 效 . 通过 计算 可 以 发 现 ,RB 模型 隐 
藏 解 之 后 , 解 的 个 数 和 解 的 分 布 都 几乎 没有 变化 ,这 一 点 也 得 到 实验 的 证 实 . 下 面 举例 说 明 
如 何 构造 一 个 最 大 团 的 难 解 算 例 .该 算 例 有 4000 个 顶点 ,其 中 隐藏 了 一 个 大 小 为 100 的 团 . 


算法 12.8 用 RB 模 型 产生 最 大 团 难 解 算 例 

输入 : 图 的 顶点 数 4000, 要 隐藏 的 最 大 团 的 大 小 为 100. 

输出 : 一 个 有 4000 个 顶点 的 图 ,其 中 隐藏 了 100 个 顶点 的 最 大 团 . 

1. 把 4000 个 顶点 分 成 100 组 ,每 组 40 个 顶点 . 

2. 从 每 组 随机 挑选 一 个 顶点 , 共 挑 出 100 个 顶点 ,把 这 100 个 顶点 相互 之 间 都 连 上 边 ,得 到 一 个 大 小 
为 100 的 团 . 

3. 然后 在 不 同 组 的 顶点 之 间 随 机 连 边 , 连 的 总 边 数 m 参照 算法 12.6 和 定理 12. 5( 或 定理 12. 6) 用 参 
数 + 和 jp 来 定 ,其 中 w=100,d 二 40( 由 此 可 推算 出 a) ,k 一 2. 


上 述 实 例 中 , 同 组 内 的 顶点 之 间 不 连任 何 边 ,这 样 就 保证 了 存在 恰好 100 个 顶点 的 最 大 


团 ( 虽 然 可 能 不 唯一 ). 这 个 最 大 团 问题 的 实例 也 可 以 看 作 是 一 个 RB 模型 的 实例 ,其 中 有 
7 一 100 个 变量 ,对 应 于 100 组 顶点 ;每 个 变量 有 d 二 40 种 不 同 取 值 ,对 应 于 每 组 内 40 个 顶 
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点 ;每 个 约束 包含 人 一 2 个 变量 ,对 应 着 两 组 顶点 ;实例 图 中 两 组 顶点 之 间 的 那些 边 , 就 代表 
两 个 变量 之 间 的 相 容 赋值 , 即 边 的 两 端点 在 各 自 组 内 代表 的 变量 值 的 组 合 ,所 以 这 是 用 RB 
模型 生成 的 隐藏 最 优 解 的 难 解 算 例 . 这 个 最 大 团 的 算 例 的 确 是 难 解 的 ,按照 目前 最 好 的 算法 
的 性 能 来 估计 ,即使 考虑 到 摩尔 定律 的 效果 ,在 今后 20 年 内 用 普通 微机 也 难以 在 一 天 之 内 
找 出 这 种 实例 中 的 最 大 团 . 

用 RB 模型 也 能 类 似 地 生成 其 他 NP 完全 问题 的 难 解 算 例 , 基 于 RB 模型 的 算 例 已 经 被 
多 项 国际 算法 竞赛 和 大 量 研究 论文 采用 ,实际 效果 也 表明 这 些 实例 的 确 是 难 解 的 .更 多 的 算 
例 和 目前 的 求解 记录 以 及 参考 文献 请 参看 下 列 网 址 : http://www. nlsde. buaa. edu. cn/ 一 


kexu/benchmarks/graph-benchmarks. htm. 


12.7 基于 统计 物理 的 消息 传递 算法 


在 20 世纪 80 年 代 ,Parisi 等 人 在 旋转 玻璃 上 的 工作 取得 了 统计 物理 在 无 序 系统 研究 
方面 的 重要 进展 , 那 时 人 们 已 经 知道 ,无 序 系统 的 统计 物理 与 计算 机 科学 中 的 组 合 优 化 问题 
有 密切 联系 , 即 优化 问题 中 的 成 本 函数 可 以 对 应 于 无 序 系统 中 的 能 量 函 数 , 优 化 问题 的 最 优 
解 可 以 对 应 于 低温 结晶 状态 . 但 是 这 些 工作 没有 引起 计算 机 科学 家 的 关注 ,因为 当时 的 计算 
机 科学 更 关注 具体 实例 在 最 坏 情 况 下 的 时 间 复 杂 性 ,而 统计 物理 学 家 关注 随机 实例 的 平均 
情形 时 间 复 杂 性 .到 了 20 世纪 90 年 代 , 随 着 在 人 工 智能 研究 中 发 现 了 计算 问题 的 相 变现 象 
之 后 ,统计 物理 中 已 有 的 成 果 被 迅速 应 用 到 计算 机 科学 问题 上 ,取得 了 很 大 成 功 . 基于 统计 
物理 的 消息 传递 算法 (如 survey propagation ) 在 距离 可 满足 性 相 变 点 很 近 的 地 方 求解 随机 
实例 的 效率 比 以 往 的 算法 提高 了 两 个 数量 级 . 目前 ,结合 了 统计 物理 算法 和 局 部 搜索 算法 的 
程序 已 经 能 够 求解 100 万 个 变量 的 随机 3SAT 实例 ,这 是 在 以 往 采用 其 他 算法 做 不 到 的 . 本 
节 介 绍 一 种 基于 统计 物理 的 消息 传递 算法 . 


12.7.1 消息 传 尼 算法 与 回 湖 法 、 局 部 搜索 算法 的 比较 


基于 统计 物理 模型 的 消息 传递 (message passing) 算 法 是 与 回溯 算法 和 局 部 搜索 算法 不 
同 的 算法 策略 . 下 面 以 约束 满足 问题 为 例 , 先 简单 介绍 这 几 种 算法 之 间 的 不 同 ,以 便于 读者 
理解 消息 传递 算法 的 特色 ,然后 再 详细 介绍 一 种 具体 的 消息 传递 算法 . 

最 早 用 于 解决 约束 满足 问题 的 算法 策略 之 一 就 是 回溯 法 ,比如 求解 SAT 问题 的 著名 的 
DPLL 算法 . 回溯 算法 为 变量 逐个 赋值 , 当 遇 到 不 能 满足 的 约束 时 ,就 回溯 改变 上 一 个 变量 
的 赋值 ,直到 找到 一 个 解 ,或 者 最 终 宣布 无 解 . 回溯 算法 在 很 多 简单 情况 下 是 有 效 的 ,但 是 在 
最 坏 情况 下 往往 是 指数 时 间 的 . 

局 部 搜索 或 随机 游 动 算法 一 开始 就 为 所 有 变量 赋值 ,如果 这 个 赋值 不 是 解 , 则 任意 改变 
一 个 变量 的 赋值 ,这 样 重复 进行 直到 找到 解 , 或 者 执行 足够 多 步 后 宣布 失败 . 局 部 搜索 算法 
是 一 种 不 完全 算法 , 它 有 可 能 漏 掉 解 ,但 实际 上 执行 足够 多 步 之 后 ,这 种 可 能 性 可 以 降 到 很 
低 . 局 部 搜索 算法 对 于 求解 SAT 问题 非常 有 效 . 

在 回溯 法 和 局 部 搜索 法 中 ,除了 检查 目前 的 赋值 是 否 满足 给 定 的 约束 外 ,并 没有 利用 或 
很 少 利用 到 实例 的 结构 信息 . 在 消息 传递 算法 中 ,变量 结 点 和 约束 结 点 之 间 来 回 传递 信息 ， 
而 且 变 量 只 向 它 在 其 中 出 现 的 约束 传递 消息 ,约束 也 只 跟 它 里 面包 含 的 变量 传递 消息 ,这 样 
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就 利用 到 了 实例 本 身 的 结构 信息 .在 回溯 法 和 局 部 搜索 法 中 ,采用 的 是 硬 决策 , 即 直接 为 变 
量 赋值 . 在 消息 传递 算法 中 ,采用 的 是 软 决策 , 即 不 直接 为 变量 赋值 ,而 是 计算 每 个 变量 取 某 
个 值 的 概率 分 布 ,通过 不 断 迭 代 来 修正 这 个 概率 分 布 ,直到 取 某 个 值 的 概率 明显 占 优 , 则 确 
定 采 用 这 个 赋值 ;或 者 到 概率 分 布 没有 明显 改进 为 止 , 再 采用 其 他 方法 来 决定 这 个 变量 的 取 
值 ,比如 局 部 搜索 法 等 .更 新 概率 的 规则 是 基于 统计 物理 模型 来 制定 的 ,根据 消息 的 含义 和 
更 新 规则 ,消息 传递 算法 由 简单 到 复杂 又 可 分 为 警告 传播 算法 (warning propagation, 简称 
WP 算法 )、 置 信 传 播 算法 (belief propagation, 简称 BP 算法 )、 调 查 传播 算法 (survey 
propagation ,简称 SP 算法 ) 等 .下 面 以 一 种 针对 随机 3SAT 问题 的 SP 算法 为 例 , 来 简单 介绍 
基于 统计 物理 的 消息 传递 算法 . 


12.7.2 用 消息 传送 算法 求解 3SAT 问题 


这 种 专门 针对 随机 3SAT 的 SP 算法 结合 了 消息 传递 算法 和 局 部 搜索 算法 . 作为 消息 传 
递 算法 ,这 个 算法 利用 二 部 图 来 表示 SAT 的 实例 ,分 别 以 每 个 子 句 和 每 个 变量 (或 文字 ) 作 
为 一 个 顶点 ,如 果 一 个 变量 x 的 文字 / 在 一 个 子 句 C 中 出 现 , 就 在 这 个 变量 顶点 和 子 句 顶点 
之 间 连 上 边 , 沿 着 这 条 边 子 句 C 可 以 看 到 文字 ! 并 且 给 文字 发 送 消息 yc-… 每 个 变量 (或 文 
字 ) 只 收 到 它 在 其 中 出 现 的 子 句 的 消息 ,每 个 子 句 只 看 到 它 包 含 的 变量 或 文字 ,也 只 向 它们 
发 送 消息 . 

算法 是 个 不 断 迭 代 的 过 程 ,在 每 轮 迭 代 内 部 ,每 个 变量 (或 文字 ) 顶 点 根据 它 收 到 的 全 部 
消息 来 决定 它 的 当前 赋值 ,比如 每 条 消息 可 以 取 0 或 1 的 值 ,表示 真 或 假 的 意思 ,变量 把 收 
到 的 消息 当 作 投票 ,按照 多 数 获 胜 的 原则 决定 自己 的 赋值 ,然后 每 个 子 句 根 据 自 己 看 到 的 变 
量 ( 或 文字 ) 的 赋值 ,再 向 每 个 变量 (或 文字 ) 发 送 消息 ,比如 当 一 个 三 元 子 句 看 到 两 个 文字 都 
已 经 赋值 为 假 时 ,就 要 向 第 3 个 文字 发 警告 消息 “你 应 当 赋值 为 真 ”这 正 是 warning 的 意 
思 ) ,这 样 就 完成 一 轮 . 

算法 的 奇妙 之 处 在 于 ,从 任意 一 个 初始 赋值 开始 ,经 过 不 断 迭 代 , 有 些 变量 或 文字 就 逐 
步 找到 了 正确 的 赋值 . 如 果 给 消息 加 上 灵活 性 ,不 是 简单 地 表示 真 或 假 , 而 是 表示 真 或 假 的 
概率 (这 正 是 belief 或 survey 的 意思 ) ,算法 的 能 力 就 更 精巧 了 , 当 某 个 变量 赋 某 个 值 的 概 
率 很 大 时 ,就 选 定 这 个 变量 代入 这 个 赋值 对 公式 进行 化 简 , 当 所 有 剩余 变量 的 赋值 的 倾向 性 
都 不 明显 时 ,就 运行 局 部 搜索 算法 .算法 的 关键 在 于 设计 消息 的 含义 和 设计 如 何 更 新 消息 的 
机 制 . 在 这 方面 , 跟 模 拟 退 火 法 一 样 ,人 们 从 统计 物理 学 中 得 到 启发 ,根据 一 些 物 理 模 型 来 设 
计算 法 的 细节 ,在 这 里 我 们 就 不 去 详细 介绍 算法 背后 的 物理 模型 了 ,有 兴趣 的 读者 可 查阅 有 
关 论 文 或 书籍 . 

随机 3SAT 模型 ”给 定 变 元 个 数 nw 和 子 句 个 数 m ,从 2n 个 文字 的 所 有 长 度 为 3 的 子 句 
中 均匀 随机 选择 m 个 子 句 ,这 些 子 句 的 合 取 就 构成 一 个 随机 3SAT 公式 . 


算法 12.9 随机 3SAT 的 SP 算法 

输入 : 随机 3SAT 公式 . 

输出 : 一 个 满足 赋值 . 

选 定 某 个 临界 值 。 盖 0. 对 每 个 子 句 C 和 每 个 文字 7, 车 /在 C 中 出 现 , 则 按照 下 列 规则 计算 值 xc- 
1. 开始 时 ,按照 [0,1] 上 的 均匀 分 布 .为 每 个 yc-: 独 立 随机 赋值 . 

2. 对 每 个 子 句 C, 按 照 文 字 的 随机 排列 顺序 ,根据 下 列 规则 3 一 5 迭代 更 新 Yc 


代 法 设计 与 分 帮 ( 血 2 版 ) 


Ee 
= 天 Ye 
Cuec 
了 Ye 
CuECAC=C 
其 中 约定 空 的 乘积 等 于 1. 
4. 车 C=jVkVL, 则 令 
a 下 
we 一 1- (1 一 画 十 丰 二 志 不 ) (1 一 云 十 逐一 去 肥 ) 
车 C=kVL4, 则 令 
Zr 


ag 
这 里 的 是 文字 的 否定 . 
5. 当 所 有 Yc- 的 更 新 都 小 于 e 时 ,停止 迭代 更 新 Yc. 


6. 找 出 二 最 大 的 变量 x, 这 里 的 二 是 x 的 否定 如果 这 个 绝对 值 小 于 。, 则 运行 随机 
游 动 算法 . 
7. 当 五 二 做 和 估 z->0 时 ,把 赋值 为 真 , 当 亏 干 颖 二 估 z-<0 时 ,把 z+ 赋值 为 假 ,化 简 公式 , 回 到 第 


2 步 ,对 剩余 的 公式 继续 和 代 更 新 Ye- 说明: 元 下 参 王佐 7- 一 0 的 情况 包含 在 第 6 步 中 处 理 ) 


目前 对 于 这 种 算法 在 随机 3SAT 上 为 何如 此 有 效 , 以 及 类 似 的 策略 能 否 应 用 到 其 他 问 
题 上 ,还 在 进一步 研究 中 . 


12.8 量子 算法 简介 


随 着 计算 机 硬件 尺寸 越 来 越 小 ,人 们 开始 考虑 如 何 利用 微观 世界 的 量子 效应 ,量子 算法 
就 是 基于 量子 物理 学 原理 在 量子 计算 机 上 运行 的 算法 , 它 在 一 定 场 合 下 比 经 典 算法 更 强 . 本 
节 只 简单 介绍 量子 算法 的 基本 概念 ,包括 量子 比特 和 量子 门 ,然后 举 一 个 最 简单 的 例子 说 明 
量子 算法 有 可 能 比 经 典 算法 更 强 . 


12.8.1 量子 比特 


用 19) 这 样 的 记号 表示 量子 比特 ,以 区 别 于 经 典 比 特 , 这 种 记号 称 为 迪 拉 克 (Dirac) 记 
号 ,下 面 会 解释 它 的 优点 . 经典 比 特有 两 个 取 值 0 和 1, 其 物理 实现 可 以 是 电压 的 高 和 低 、 开 
关 的 断 和 通 等 ,在 经 典 世 界 中 这 些 状态 不 能 释 加 ,比如 开关 不 能 同时 既 断 又 通 ,所 以 经 典 比 
特 要 么 为 0、 要 么 为 1. 量子 比特 也 有 值 10; 和 |1) ,其 物理 实现 可 以 是 电子 的 两 个 自 旋 方向 、 
光子 的 两 个 偏振 方向 .原子 的 两 个 能 级 等 ,但 在 量子 世界 中 这 些 状 态 是 可 以 三 加 的 .比如 电 
子 可 以 同时 处 在 两 个 自 旋 方向 上 光子 可 以 同时 具有 两 个 偏振 方向 .原子 可 以 同时 处 于 两 个 
能 级 等 ,所 以 量子 比特 还 可 以 是 10) 和 |1) 的 线性 又 加 , 即 形 如 al0) 十 811) 的 又 加 态 , 其 中 
和 8B 是 两 个 复数 , 称 为 几率 幅 , 表 示 处 在 10) 的 概率 是 |al? .处 在 |1) 的 概率 是 |8|?, 这 里 |a| 表 
示 复 数 a 的 模 ,所 以 a 和 8 要 满足 |a|? 十 |B|?=1. 

用 线性 代数 的 话 来 说 ,量子 比特 就 是 一 个 2 维 复 系 数 线性 空间 中 的 单位 向 量 . 如 果 用 
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10) 和 |1) 作 为 一 组 基 , 称 为 计算 基 (computational bases, 简称 基 ), 相 应 的 坐标 表示 就 是 


I0) (os Qa Fall1) (1: 于 是 12) 这 样 的 记号 就 表示 了 列 向 量 除了 10) 和 
是 | a 
1/V2 = 这 信友 

作为 一 组 基 . 通常 都 用 |0) 和 |1) 作 为 基 , 除 非 另 加 说 明 . 

两 个 或 多 个 量子 比特 可 以 组 成 量子 寄存 器 ,还 用 线性 代数 的 话 来 说 ,量子 寄存 器 的 状态 
就 是 各 个 量子 比特 状态 的 张 量 积 . 所谓 张 量 积 , 是 两 个 以 上 线性 空间 或 两 个 以 上 向 量 之 间 的 
一 种 运算 ,两 个 线性 空间 的 张 量 积 还 是 一 个 线性 空间 , 它 的 维 数 等 于 原来 两 个 线性 空间 维 数 
之 积 , 它 的 基 等 于 原来 两 个 线性 空间 的 基 的 卡 氏 积 , 即 对 于 原来 两 个 线性 空间 的 每 一 对 基 
| 让 和 | 站 ,在 张 量 积 空 间 有 一 个 对 应 的 基 , 记 作 | 店 @| 站 ,也 简 记 作 | 店 17 ,1i, 丫 或 | 订 ). 从 原 
来 两 个 线性 空间 中 各 取 一 个 向 量 ,在 张 量 积 空间 有 一 个 对 应 的 向 量 , 等 于 把 原来 两 个 向 量 用 
@ 相 乘 并 按照 分 配 律 展开 的 结果 . 例如 向 量 m10) 十 B11) 和 as10) 十 B11) 的 张 量 积 就 是 
(a10)+B 11) (a10)+B 11))=aras 100)+apB 101)+Bias |10)+BB|11). 

两 个 经 典 比特 构成 的 经 典 寄 存 器 共有 4 个 状态 00、01、10、11. 两 个 量子 比特 构成 的 量 
子 寄存 器 也 有 4 个 基 |00),101) ,110) ,111) ,以 及 这 4 个 基 的 线性 县 加 态 a|00) 十 B8101) 十 
7Y110) 十 6111) ,其 中 a,8,7,6 都 是 复数 ,也 称 为 几率 幅 , 也 满足 |c|: 十 18|: 十 1y|: 十 16|: 一 1， 
一 般 地 ,n 个 量子 比特 构成 的 量子 寄存 器 有 2" 个 基 |00…0)、|00…1)、…、|11…1) ,每 个 基 
对 应 一 个 长 度 为 n 的 0-1 串 .量子 寄存 器 的 状态 是 这 2" 个 基态 的 县 加 态 . 而 2" 个 几率 幅 也 
满足 模 的 平方 和 等 于 1 的 条 件 ,描述 这 样 的 一 个 状态 就 需要 2" 个 几率 幅 . 在 直观 上 , 若 用 经 
典 寄存 器 来 模拟 个 量子 比特 构成 的 量子 寄存 器 的 状态 ,就 需要 保存 2" 个 几率 幅 , 这 个 开 
销 是 指数 增长 的 . 著名 物理 学 家 费 曼 (Feynman) 在 用 经 典 计算 机 模拟 量子 系统 的 时 候 就 遇 
到 了 这 个 问题 ,从 而 最 早 提出 了 量子 计算 机 的 设想 . 由 于 县 加 态 的 存在 ,使 得 量子 计算 机 不 
仅 有 可 能 在 存储 能 力 上 比 经 典 计 算 机 更 强 , 而 且 还 具备 了 并 行 处 理 能 力 . 


12.8.2 正 交 测量 


虽然 量子 比特 可 以 具有 全 加 态 ,几率 幅 a 和 有 作为 复数 里 面包 含有 无 穷 多 位 的 信息 ,但 
却 不 能 通过 物理 测量 来 得 到 几率 幅 , 因 此 无 法 直接 利用 这 些 信息 ,对 量子 比特 最 简单 的 测量 
是 下 面 介绍 的 正 交 测量 . 在 量子 比特 的 线性 空间 上 可 以 定义 一 个 内 积 , 即 对 于 两 个 量子 比特 


1$) =a10) +811) = 全 和 9 一 yz10)? 十 5 DD 一 [1 全 内 积 人 me ry (= 
oy 十 86, 其 中 % 是 wa 的 共 恩 复数 .这样 的 线性 空间 称 为 希 尔 伯 特 空间 . 约定 对 于 一 般 的 列 


向 量 多 一 10) 二 8 一 | 中 ,让 (el 表示 19y 的 共生 转 时, 即 让 (01 一 1.0).0 =(0,1), 


和 | 一 )==-(10) 一 |1))= 


: 1 
1) 外 ;还 有 | 十 ;= 一 (10) 十 |1))= 
11) 外 ,还 有 | 万 lo 1 | 万 


(gp|==a* (0| 十 Bp* (1|= 二 (a* ,8B ), 于 是 内 积 ($,q) 就 可 以 记 作 ($y) ,或 简 记 作 (819). 这 是 
采用 |g) 这 样 的 记号 的 另 一 个 好 处 , 即 容易 表示 复 向 量 的 共 思 转 置 . 由 于 4011)= 二 (110)==0 
和 (4010) 二 (111) 二 1, 所 以 10) 和 |1) 是 一 组 标准 正 交 基 . 同样 可 以 验证 | 十 ”和 | 一 > 是 另 一 组 
标准 正 交 基 . 每 个 正 交 测量 由 一 组 正 交 基 表 示 .一 次 测量 的 结果 就 是 一 个 随机 变量 . 取 值 就 
是 测量 所 用 的 各 个 正 交 基 , 概 率 就 是 对 应 几率 幅 的 模 的 平方 . 例如 ,在 10; 和 |1) 下 测量 
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19) 二 a10) 十 B11) ,结果 就 是 以 概率 |al? 得 到 |10) ,以 概率 18|: 得 到 |1) ,这 正 是 前 面 说 量子 
比特 可 以 同时 处 在 10) 和 |1) 上 的 精确 含义 . 


在 基 |0) 和 |1) 下 测量 | 十 ) 一 廊 (10) 十 11)), 就 能 以 等 概率 1/2 分 别 得 到 10) 或 |1). 这 


相当 于 抛掷 一 枚 均匀 硬币 的 结果 ,所 以 量子 算法 天 然 就 能 轻松 地 模拟 经 典 随机 算法 . 虽然 几 
率 幅 可 以 是 复数 ,但 对 于 量子 算法 而 言 , 几 率 幅 只 需 取 实 数 就 够 了 . 因为 有 人 证 明了 ,这 样 的 
限制 不 会 降低 量子 算法 的 能 力 . 经 典 概率 只 能 是 非 负 实 数 , 几 率 幅 既 可 以 是 正 数 ,也 可 以 是 
负数 , 正 负 还 可 以 互相 抵消 ,这 是 量子 算法 比 经 典 随机 算法 更 强 的 一 个 原因 . 

在 测量 之 后 ,原来 的 量子 比特 就 变 成 测量 结果 中 出 现 的 那个 正 交 基 , 而 原来 的 状态 就 消 
失 了 .虽然 一 个 量子 比特 中 包含 无 穷 多 的 信息 .但 如 果 通过 正 交 测 量 来 读 取 它 ,一 次 也 只 能 
得 到 一 个 经 典 比 特 的 信息 ,并 且 一 次 测量 之 后 ,原来 的 状态 就 被 破坏 了 ,除非 原来 的 状态 恰 
好 等 于 正 交 测 量 的 某 个 正 交 基 ,这 样 测量 就 得 到 确定 的 结果 , 且 测量 后 原来 的 状态 不 变 . 量 
子 测量 的 这 种 性 质 在 一 定 程度 上 抵消 了 量子 倒 加 态 带 来 的 好 处 ,给 量子 算法 的 性 能 带 来 了 
严重 限制 . 计算 复杂 性 理论 中 有 证 据 表明 ,量子 算法 大 概 和 概率 算法 一 样 ,都 不 能 在 多 项 式 
时 间 内 解决 NP 完全 问题 . 虽然 如 此 ,对 于 某 些 特定 的 问题 ,量子 算法 依然 比 经 典 算法 更 强 ， 


12.8.3 量子 门 


我 们 采用 著名 计算 机 科学 家 姚 期 智 先生 提出 的 量子 电路 模型 来 描述 量子 算法 ,量子 电 
路 的 基本 运算 单元 是 量子 门 . 在 经 典 计 算 中 ,经 典 比特 是 逻辑 真 值 , 基 本 运算 是 3 种 逻辑 运 
算 与 或 . 非 , 相 应 地 称 为 与 门 或 门 非 门 ,任何 其 他 复杂 运算 都 能 用 这 3 种 基本 运算 的 组 合 
来 表示 . 而 在 量子 计算 中 ,量子 比特 是 希 尔 伯 特 空间 中 的 单位 向 量 . 在 量子 比特 上 的 基本 操作 
除了 上 述 的 正 交 测 量 外 ,还 有 保持 向 量 长 度 不 变 的 线性 变换 ,就 是 数学 上 所 说 的 酉 变换 (物理 
学 上 称 为 么 正 变换 ), 这 些 变换 就 称 为 量子 门 . 量子 门 可 以 用 西方 阵 来 表示 , 即 满足 UiU= 
UUi = 了 的 方 阵 U, 其 中 Ut 是 U 的 共 思 转 轩 ,I 是 单位 阵 . 一 个 量子 门 U 作用 在 量子 比特 
1g) 上 的 结果 ,就 得 到 量子 比特 Ulg). 注意 .量子 门 作为 西 变 换 , 都 是 可 逆 的 ,而 经 典 与 门 和 
或 门 都 不 是 可 逆 的 ,只 有 经 典 非 门 是 可 北 的 . 下面 列 出 的 量子 门 都 是 西 变换 ,请 读者 自行 验 
证 , 留 做 习题. 


容易 看 


i 1 
E 小 二 V2 V2 | 
oh = 2 44, 

V2 V2 
出 ,I 是 恒 等 映 射 ;X10) = 11) 和 X11) = 二 10),X 相当 于 非 门 ,起 翻转 比特 的 作用 ;2Z10) = 
10 和 2Z11》 11), 但 Z| 十 )=| 一 ) 和 ZI 一)=| 十 ),Z 对 于 另 一 组 基 | 十 ) 和 | 一 ?起 非 门 的 
作用 ;五 称 为 哈达 玛 门 ,HI0)==| 十 ) 和 HI|1)==| 一 ), 以 及 了 H| 十 ;=10) 和 瑟 | 一 )=|1), 所 
以 五 在 两 组 不 同 基 之 间 起 坐标 变换 作用 ;另外 ,如 前 所 述 , 玉 也 用 来 模拟 抛 硬币 : 先 让 
五 |0 王 | 十 ) ,然后 再 测量 | 十 》. 


先 看 单 比特 量子 门 上 jx 0 ,2 
"| 1 0 


看 两 比特 量子 门 CN 一 人 x]-|" 。 1 | 约定 空白 处 都 是 0. 容易 看 出 


处 理 难 解 问题 的 笋 略 


CNI00)=|00》`CNI01)=|101》 .CN110)= 二 111) .CN111)= 二 110), 这 个 CN 称 为 受 控 非 门 
(Controlled-Not) ,因为 当 第 1 个 量子 比特 等 于 1 时 ,就 对 第 2 个 量子 比特 做 非 运算 ,否则 什 
么 都 不 做 .第 1 个 量子 比特 称 为 控制 比特 ,第 2 个 比特 称 为 目标 比特 ,把 这 样 的 门 记 作 
CN , 即 CNizla,0) 一 |a,a 四 多, 其 中 由 表示 异 或 运算 或 模 2 加 法 . 类 似 地 可 定义 CN,1， 
让 第 2 个 比特 作 控 制 ,第 1 个 比特 作 目 标 , 即 CNalla,p) 一 |c 人 0,20). 

定理 12.7 不 存在 两 比特 量子 门 COPY, 使 得 对 于 任意 量子 比特 19 ,COPY|9)10) 二 
lp) 19). 

证 用 反 证 法 ,假设 存在 这 样 的 两 比特 量子 门 COPY, 则 按照 COPY 的 定义 ,就 有 

COFY | | =] 0 10 COPY| 0 =| |W 
当 |g) 二 a10) 十 B11) 时 ,按照 COPY 的 定义 ,就 有 
COPY | p) 10)=| 9) | 9) = (a|0)+B|1))(a| 0)+B|1)) 
=a?|0)|10)+aB|o0)|1)+Ba|1)|0)+B|1)|1) 
但 是 按照 COPY 的 线性 性 质 (量子 门 都 是 线性 变换 ) ,就 有 
COPY | gp) | 0)= COPY(a | 0)+B|1)) |0) 
= COPY(a | 0 10? 十 8B11)10)) = 一 cl10)10? 十 811)11) 

对 比 上 述 两 个 结果 ,对 于 任意 的 a 和 8B 不 会 总 是 相同 的 ,所 以 这 是 矛盾 . 

上 述 定理 表明 量子 信息 不 可 克隆 , 即 在 量子 算法 中 ,不 能 像 经 典 算法 那样 随便 把 一 个 变 
量 的 值 赋 给 另 一 个 变量 ,保留 同一 个 值 的 两 个 副本 ,只 能 保留 一 个 副本 . 但 我 们 可 以 交换 两 
个 变量 的 赋值 , 即 存在 两 比特 量子 门 SWAP ,使 得 SWAPla)15)= 二 15)1a), 而 这 只 需要 3 次 
使 用 受 控 非 门 CN 即 可 实现 : 

CNi.z1a)16)=|a) la®Db) 
CNs11a)la®Bb)=|aB(aBb)) laBb)=16) 1aDb) 
CNi.216) la®Bb)=16) | (aBb) Bb) =16) 1a) 

当 给 定 一 个 函数 f/:{0,1} 一 {0,1} 时 ,用 函数 门 Oj1a)15) 二 1a)1b 四 f(a)) 来 获得 函数 
/在 输入 a 上 的 值 /(a) ,注意 每 次 使 用 函数 门 涉及 两 个 量子 比特 ,一 个 保存 输入 ,一 个 保存 输 
出 . 对 于 一 般 的 函数 /:{0.1)" 一 {0,1)”, 也 用 函数 门 Oj1a)15) 二 1a)165 四 f(a)) 来 获得 函数 在 
输入 a 上 的 值 f(a), 只 不 过 这 时 |a) 是 一 个 位 量子 寄存 器 ( 即 n 个 量子 比特 ) ,而 15) 是 一 个 
位 量子 寄存 器 ,所 以 每 次 使 用 函数 门 涉及 nn 十 m 个 量子 比特 . 之 所 以 这 样 定 义 Or ,是 为 了 保证 
Os 是 酉 变换 ,因为 一 般 情况 下 Of la) 二 1f(a)) 不 是 可 逆 的 ,而 西 变换 都 是 可 道 的 . 这 样 的 函数 
门 也 叫做 外 部 信息 源 (Oracle) 门 ,或 查询 (Query) 门 ,因为 我 们 只 要 准备 好 输入 a, 就 能 立即 获得 
函数 值 f(a) ,而 不 需要 知道 计算 f 的 详细 过 程 ,也 不 需要 花费 实际 计算 f(a) 的 代价 , 换 句 话说 ， 
我 们 把 函数 当成 一 个 免费 暗箱 (Black-box) 来 对 待 ,只 关心 输入 和 输出 ,而 不 关心 内 部 细节 . 


12.8.4 一 个 量子 算法 


假设 有 一 个 函数 f:{0,1) 一 {0.1) ,我 们 想 知 道 /1(0) 二 A(1) 还 是 1(0) 关 1(1). 如 果 采 
用 经 典 算法 ,至 少 需要 两 次 求 出 了 的 值 , 即 分 别 求 出 1(0) 和 f(1) 的 值 ,然后 才能 给 出 正确 
答案 . 这 是 因为 如 果 只 求 出 /(0) 的 值 ,那么 可 以 假设 /(1) 的 值 被 一 个 对 手 (Adversary) 所 
控制 ,无论 给 出 什么 答案 ,对 手 总 是 可 以 控制 /(1) 的 值 ,让 答案 出 错 .但 是 下 述 的 道奇 
(Deutsch) 算 法 却 能 只 求 一 次 f 的 值 ,就 得 出 正确 答案 ,算法 的 关键 是 利用 了 又 加 态 , 求 一 次 
函数 的 值 就 同时 获得 了 /(0) 和 f(1) 的 值 ,并 且 巧 妙 地 利用 变换 和 测量 来 得 到 所 需要 的 信 
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息 , 这 个 算法 清楚 地 说 明了 量子 算法 的 特点 . 
算法 12.10 道奇 算法 
输入 : 以 暗箱 形式 给 出 的 函数 /:{0.1} 一 {0,1} ,两 比特 量子 寄存 器 初始 状态 10) 11). 
输出 : 宣布 /(0) 二 /(1), 或 者 宣布 /(0) 了 /01). 
1. 对 寄存 器 的 两 个 量子 比特 分 别 作用 哈达 玛 门 有 H; 
2. 对 寄存 器 的 两 个 量子 比特 共同 作用 函数 门 Oj ; 
3. 对 寄存 器 的 第 1 个 量子 比特 作用 哈达 玛 门 互 ; 
4. 测量 寄存 器 的 第 1 个 量子 比特 ,如 果 测 量 结果 是 10) 就 宣布 /(0) 二 1(1), 如 果 是 11) 就 宣布 
/OAD. 


定理 12.8 道奇 算法 正确 解决 上 述 问题 , 且 只 求 一 次 函数 值 . 

证 显然 算法 只 在 第 2 步 用 了 一 次 函数 门 (注意 每 次 使 用 函数 门 涉及 两 个 量子 比特 )， 
即 只 求 一 次 函数 值 . 

下 面 跟踪 量子 寄存 器 两 个 量子 比特 的 状态 ,来 证 明 算法 的 正确 性 . 在 第 1 步 之 后 ,寄存 
器 的 状态 是 (回忆 一 下 , 互 |10) 王 | 十 ) 和 五 |1) 一 | 一 >) : 
1 
AZ 
二 (| 0》| 0》 loy hwy FI ay Noy =| 0 
在 第 2 步 之 后 状态 是 (回忆 一 下 ,O10》10)==10)10@f(0)) ,O410)11)==10)11 田 f(0)) 等 ) 


六 (| oo | 0 | 1@ FONW FI W|I OBDS | | L@ FD 


|! 
(| 0 十 | 1)) <I'0% =) DY 
+ 友 


= 去 (| o> | 一 0 | 四 天 0 站 于 [| | FD = DILDONDNY 


一 序 | 0》(| fC0)) 一 | 1 田 /o))) 十 于 | WC] RS =1 1 RDN 


以 下 分 两 种 情况 : 
(1) 当 了 (0)== 了 OD 时 ,1f00)) 一 |1@@f(0))=1f(1)) 一 |1@@f(1)), 所 以 上 述 第 2 步 以 


1 i 1 
状态 是 二 < | 
后 的 状态 是 了 ( 0 十 |1?)(| Go) 一 11 四 Fo)>) Be t [导入 |11@®7(0))) 


Di 
[+ (fC0))—11@7(0))). 
厄 a Y 


此 时 第 3 步 之 后 的 状态 是 (回忆 一 下 ,五 | 十 ) 王 10?) : 


1 
10)—(| f(0)) —| 1@® f(0))) 
Td 了 


所 以 第 4 步 的 测量 百分之百 得 出 10) ,算法 宣布 F(0) 王 y(1) 就 是 正确 的 . 
(2) 当 (00) 关 f(1D) 时 , 即 (0)==1 田 f(1) 和 f(1)=1 田 f(0) 时 ,这 时 |f(0)) 一 |1@ 


(0))== 一 (| (1)) 一 11 加 /01))), 此 时 第 2 步 以 后 的 状态 是 去 (10) 一 11))(1/(0)) 一 11@ 


g 1 1 a . 
(0))) COS— 1 (DO IBDAMNDI= |— O70 IF. 
a 万 x 好 厄 站 ba 


此 时 第 3 步 之 后 的 状态 是 (回忆 一 下 HI 一 ) 二 11)) 


处 理 难 解 问题 的 身 略 


1 
DC F000 —| LO FO 
| 万 1 | eB 


所 以 第 4 步 的 测量 百分之百 得 出 11) ,算法 宣布 /(0) 关 有 (1) 就 是 正确 的 . 

上 述 的 道奇 算法 是 人 们 找到 的 第 1 个 比 经 典 算法 加 速 一 们 的 量子 算法 .后 来 人 们 又 找 
到 了 格 罗 乌 (Grove) 量 子 算 法 . 它 从 NN 个 输入 (每 个 输入 带 标记 或 不 带 标 记 ) 中 找 出 一 个 带 
标记 的 输入 ,只 花费 OCVN) 时 间 , 比 花费 OCN) 时 间 的 经 典 算法 有 平方 级 的 加 速 ; 当 这 个 算 
法 用 于 NP 完全 问题 的 求解 时 ,就 可 以 让 任何 一 个 经 典 算法 都 自动 取得 平方 级 的 加 速 . 而 肖 
尔 (Shor) 量 子 算法 则 能 在 OCzlnz lnln n) 时 间 内 完成 位 整数 的 因子 分 解 , 这 比 已 知 最 快 
的 exp(@Gasln2sz)) 时 间 经 典 算 法 具有 指数 倍加 速 ,请 读者 参见 有 关 文 献 [14], 


习 题 12 


2.1 证 明 最 小 顶点 覆盖 、 最 大 团 .最 大 独立 集 在 树 上 都 是 易 解 的 . 
2.2 所 谓 区 间 图 是 这 样 的 图 ,图 的 每 个 顶点 都 对 应 于 某 条 固定 直线 上 的 一 段 区 间 ,两 个 顶 
点 相 邻 当 且 仅 当 其 对 应 的 区 间 相 交 ( 重 倒 ). 证 明 区 间 图 的 顶点 着 色 是 易 解 的 . 
2.3 ”所 谓 圆 弧 图 是 这 样 的 图 ,图 的 每 个 顶点 都 对 应 于 某 条 固定 圆周 上 的 一 段 圆 弧 ,两 个 顶 
点 相 邻 当 且 仅 当 其 对 应 的 圆 弧 相交 (重合 ). 研究 圆 弧 图 的 顶点 着 色 问 题 , 它 是 NP 完 
全 的 ,还 是 易 解 的 ? 
4 证 明 圆 弧 图 的 顶点 着 色 有 固定 参数 算法 ,其 中 参数 4 为 着 色 的 色 数 . 
5 给 出 比 正文 中 结果 更 好 的 3SAT 的 改进 的 指数 时 间 确 定 算法 . 
6 利用 随机 游 动 算 法 给 出 ASAT 的 改进 的 指数 时 间 随 机 算法 . 
2.7 给 出 ASAT 的 改进 的 指数 时 间 确 定 算法 . 
8 
9 


针对 某 个 实际 问题 应 用 一 下 模拟 退火 策略 . 

完成 定理 12.4 证 明 中 的 细节 ,并 证 明 算法 实际 可 在 O(n*) 时 间 内 运行 . 

12.10 ”按照 最 大 团 难 解 实例 的 产生 方法 ,自己 产生 一 个 难 解 实例 ,并 试验 求解 . 你 能 求 出 的 
最 大 团 有 多 少 个 顶点 ? 

2.11 产生 随机 3SAT 的 一 些 实例 .用 SP 算法 求解 这 些 实例 ,观察 m/n 最 大 到 多 少时 SP 
算法 仍然 有 效 . 

2.12 验证 12.8 节 中 介绍 的 量子 门 都 是 西 变换 . 

12.13 把 道奇 算法 推广 到 函数 /:{10,1})" 一 {0,1} 上 , 即 假设 函数 /要么 在 所 有 输入 上 都 取 

相同 的 值 ,要 么 在 一 半 的 输入 上 取 值 0, 在 另 一 半 的 输入 上 取 值 1, 设 计量 子 算法 区 

分 这 两 种 情况 . 


19. 


20. 
3. 
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